欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、昆仑万维正式发布SkyReels-A3模型:照片可根据语音对口型
昆仑万维集团推出的SkyReels-A3模型,基于DiT视频扩散模型,实现了音频驱动数字人创作。该模型能够使静态图像或视频中的人物根据语音内容开口说话或唱歌,并支持改台词、运镜控制等功能,为广告、直播带货、音乐MV等提供了高效便捷的AI技术方案。
【AiBase提要:】
📷 SkyReels-A3可将静态图像或视频中的人物根据语音内容进行动态表演。
🎥 支持长达60秒的单分镜视频输出,多分镜支持无限时长,满足不同创作需求。
🔄 提供8种预设运镜参数,强度可调节,实现专业级运镜效果。
详情链接:https://skyworkai.github.io/skyreels-a3.github.io/
2、马斯克旗下xAI宣布Grok4AI模型永久免费开放
xAI公司宣布Grok4人工智能模型将永久免费开放,为全球用户提供先进的AI工具。
【AiBase提要:】
🤖 Grok4人工智能模型将永久免费开放给全球用户。
⚙️ 提供Auto模式和Expert模式,满足不同用户需求。
🌐 免费开放可能推动AI技术的普及和应用。
3、Open AI重磅发布GPT-5提示词指南:解锁AI编程与多模态新境界
文章详细介绍了Open AI推出的GPT-5模型及其官方提示词指南,强调了其在复杂任务、编程和多模态交互方面的提升。指南提供了优化策略,如调整推理力度、控制代理行为倾向以及利用工具序言等,帮助用户最大化发挥GPT-5的潜力。
【AiBase提要:】
🧠 GPT-5通过精准的提示设计提升了代理任务、代码生成和指令遵循的表现。
💻 支持生成前端界面、调试大型代码库,并结合Responses API提高代码生成效率。
🖼️ 引入多模态交互功能,包括文本、图像、语音处理及个性化设置,增强实用性。
详情链接:https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide
4、百度搜索 PC 端全面上线 AI 搜索功能
百度搜索 PC 端全面上线一系列 AI 功能,将传统信息入口转变为任务中枢。新增的“超级智能双行框”和“工作台”模块,集成了 AI 阅读、AI 写作和 AI PPT 工具,提升了用户的搜索效率和办公体验。同时,百度 AI 搜索的月活跃用户已超过3.22亿,稳居国内 AI 搜索行业第一。
【AiBase提要:】
🧠 百度搜索 PC 端全面上线 AI 功能,提升用户搜索体验。
🛠️ 新增 “工作台” 模块,集成 AI 阅读、写作与 PPT 工具。
📈 月活跃用户达3.22亿,百度稳居国内 AI 搜索行业 第一 。
5、Windows11Co pilot 应用免费接入GPT-5,使用限制远低于 ChatGPT
微软宣布其 Windows11和 Windows10中的 Co pilot 应用已全面支持 GPT-5智能模式。该功能通过 Web 路由技术实现,用户无需更新即可启用智能模式,且在使用限制上比 ChatGPT 更加宽松。
【AiBase提要:】
🌟 Co pilot 现已支持 GPT-5智能模式,用户体验更流畅。
💬 相较于 ChatGPT,Co pilot 的使用限制更为宽松,提升自由度。
🖥️ 用户可通过简单步骤免费访问 Co pilot 和 GPT-5,方便获取信息。
6、反超OpenAI!百川智能开源医疗大模型 Baichuan-M2能力全球登顶
百川智能发布的开源医疗增强大模型 Baichuan-M2在HealthBench评测中获得60.1分,超越了OpenAI的gpt-oss120b模型,并在国际上领先于其他开源大模型。该模型经过极致轻量化处理,可在单卡部署,大幅降低医疗机构成本。同时,Baichuan-M2在复杂医疗问题处理能力上与GPT-5相当,展现出强大的应用潜力。
【AiBase提要:】
🌟 Baichuan-M2在HealthBench评测中得分60.1,成为全球领先的开源医疗模型。
💡 模型经过轻量化处理,可在单卡部署,显著降低医疗机构成本。
🚀 Baichuan-M2在复杂医疗问题处理能力上与GPT-5相当,具备广泛应用潜力。
详情链接:https://huggingface.co/baichuan-inc/Baichuan-M2-32B
7、苹果宣布GPT5将入驻iOS26:iOS26将集成ChatGPT5
苹果公司宣布将在下个月发布的iOS26系统中集成ChatGPT-5模型,这将显著提升Apple智能的性能,并带来一系列新功能,如实时翻译和内容搜索优化。用户无需OpenAI账户即可使用这些功能,但关联账户可享受更多优惠。
【AiBase提要:】
🧠 ChatGPT-5将集成至iOS26,提升Apple智能性能。
🌐 新增实时翻译功能,改善跨语言交流体验。
💰 关联OpenAI账户可享受订阅优惠,提供更多选择。
8、谷歌推出 BlenderFusion:颠覆3D 视觉编辑与生成合成的新框架
谷歌推出的BlenderFusion是一个创新框架,旨在提升3D视觉编辑与生成合成的能力,为设计师和创作者提供更直观和高效的创作工具。
【AiBase提要:】
🎨 BlenderFusion 集成了先进的3D编辑工具与扩散模型,实现了高效的3D视觉编辑与生成合成。
🛠️ 该框架的工作流程包括分层、编辑和合成三个阶段,用户可以方便地编辑3D对象并生成最终图像。
📈 谷歌的BlenderFusion通过优化模型,提升了对复杂场景的处理能力,助力设计师实现创意。
详情链接:https://blenderfusion.github.io/
9、超小的TTS模型 Kitten TTS:参数量仅为1500万
Kitten TTS 是一款开源的轻量级文本转语音模型,参数量仅为1500万,体积小于25MB,适合各种设备部署。它支持无 GPU 运行,能够在普通 CPU 上实现高质量语音合成,并提供了简单的安装和使用指南,方便用户快速上手。
【AiBase提要:】
🐱 Kitten TTS 是一款开源的轻量级文本转语音模型,体积小于25MB,适合各种设备。
⚡ 模型支持无 GPU 运行,确保用户在普通 CPU 上也能进行高质量语音合成。
🚀 Kitten TTS 已提供简单的安装和使用指南,用户可快速上手并生成音频。
详情链接:https://huggingface.co/KittenML/kitten-tts-nano-0.1
10、小钢炮4.0视觉模型MiniCPM-V4.0,手机端应用更流畅
MiniCPM-V4.0作为MiniCPM-V系列的最新版本,在视觉理解、多图及视频处理方面表现出色,并在OpenCompass评测中取得了69.0的高分,超越了多个同类模型。其专为移动设备设计,响应速度快且无发热问题,同时提供了多种使用方式和开源工具,便于用户上手。
【AiBase提要:】
🌟 MiniCPM-V4.0在OpenCompass评测中得分69.0,超越多款同类模型。
📱 该模型专为移动设备设计,响应快且无发热问题。
📚 开源iOS应用及详细使用指南,让用户更轻松上手。
详情链接:https://huggingface.co/openbmb/MiniCPM-V-4
11、Stripe 报告:AI 经济火箭式增长,营收速度超越 SaaS 三倍
Stripe 发布的最新分析报告揭示了 AI 经济的迅猛发展,包括营收增长速度、全球市场拓展和商业模式创新等趋势。报告指出,AI 初创公司实现营收里程碑的速度远超以往科技公司,并且具备‘天生全球化’的基因。
【AiBase提要:】
🚀 AI 企业营收增长速度远超传统 SaaS 企业,100万美元年化营收仅需11.5个月。
🌍 AI 公司从成立之初便具备国际化基因,第一年覆盖国家数量是 SaaS 企业的两倍。
💡 商业模式不断创新,按用量计费和按成果计费模式日益流行,推动 AI 企业快速变现。
(举报)