欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、生数科技推出 Vidu Q2,细微表情生成让AI演绎更真实!
生数科技推出的Vidu Q2模型在图生视频领域实现了重大突破,尤其在细微表情生成方面表现出色,为AI演绎提供了更加真实和生动的视觉体验。
【AiBase提要:】
🎭 Vidu Q2能够精准捕捉细微表情变化,提升视频生成的自然度和情感表达。
🎥 支持多种视频模式选择,包括图生视频、首尾帧视频以及可调时长选项,满足多样化需求。
💡 生数科技致力于通过AI技术推动创意产业发展,为用户带来更高质量的影像创作体验。
2、火山引擎推出炉米 Lumi 平台 支持视觉模型 Lora 微调
火山引擎推出的炉米 Lumi 平台,首次支持豆包、即梦等同款视觉模型的 Lora 微调功能,旨在帮助企业高效定制独特的视觉风格,满足市场需求。
【AiBase提要:】
🧠 炉米 Lumi 平台支持视觉模型的 Lora 微调功能,帮助企业定制独特的视觉风格。
🚀 该平台提供从图片生成到视频生成的全流程服务,满足企业专业场景的 AIGC 需求。
💡 炉米 Lumi 平台助力企业高效构建定制化 AIGC 生产能力,提升用户体验。
3、阿里云CTO透露:通义千问开源300+模型 下载量破6亿大关
阿里云在2025云栖大会上展示了通义千问项目的显著成就,包括开源超过300个模型和下载量突破6亿次。这表明了阿里云在AI领域的强大影响力和技术实力,并且通过开源模型推动技术创新和应用落地。
【AiBase提要:】
🚀 通义千问项目已开源300多个模型,展示出强大的技术实力。
📊 下载总量突破6亿次,体现了用户对阿里云AI技术的高度认可。
🖼️ 通义万象生成超3.9亿张图片和7000多万视频,彰显数字内容生成能力。
4、百度 Qianfan-VL 开源发布,昆仑芯助力多模态 AI 新突破
百度正式开源了其最新视觉理解模型 Qianfan-VL,包含3B、8B和70B三个版本,适用于不同场景。该模型具备强大的多模态能力,尤其在OCR和教育领域表现突出,并且训练依赖于自研的昆仑芯P800芯片。
【AiBase提要:】
🧠 Qianfan-VL 是一个强大的多模态大模型,能够同时处理图像和文本信息。
💡 昆仑芯 P800 芯片支撑模型训练,功耗低且效率高,优化大规模计算性能。
🚀 Qianfan-VL 系列已在 GitHub 和 Hugging Face 上开源,供开发者自由使用。
详情链接:https://github.com/baidubce/Qianfan-VL
5、微软引入 Anthropic AI 模型,拓展 Copilot Assistant 功能
微软宣布在 Copilot 助手中引入 Anthropic 的 AI 模型,标志着其在生成式人工智能领域的多元化战略迈出新一步。尽管与 OpenAI 的合作依然密切,微软开始引入 Anthropic 的技术以满足商业客户的需求。企业用户现在可以使用 Anthropic 的模型构建 AI 代理,并且这些模型将在亚马逊和谷歌云中运行。
【AiBase提要:】
🤖 微软在 Copilot 助手中引入 Anthropic 的 AI 模型,推动产品多元化。
🔄 Microsoft 与 OpenAI 的关系虽然仍然紧密,但逐渐使用 Anthropic 技术。
🚀 企业用户可选择 Anthropic 模型构建 AI 代理,需管理员启用后使用。
6、OpenAI 在美国新建五个数据中心,推动 Stargate 项目快速发展
OpenAI 宣布将在美国新建五个数据中心,以提升 Stargate 项目的计算能力。该项目由多家公司共同发起,总投资额高达5000亿美元,旨在推动生成式人工智能的发展。
【AiBase提要:】
🌐 OpenAI 将在美国新建五个数据中心,Stargate 项目总计算能力将达到近7GW。
💼 Oracle 将负责三个新数据中心的建设,阿比林数据中心将扩建并增加600MW 计算能力。
🚀 OpenAI 计划未来每周增加1GW 的人工智能基础设施,以推动 AI 技术的进一步发展。
7、英伟达开源 Audio2Face 模型,AI 助力实时面部动画生成
英伟达开源了其生成式 AI 面部动画模型 Audio2Face,提供了 SDK 和训练框架,支持离线和实时处理,适用于游戏、影视等多个领域。该技术已被多家游戏开发商采用,提升了角色的真实感和沉浸体验。
【AiBase提要:】
🔊 英伟达开源 Audio2Face 模型,提升虚拟角色的面部动画生成技术。
🎮 支持离线渲染和实时流式处理,适用于多种场景。
🌟 已被多个游戏开发商采用,简化制作流程并提升角色真实感。
详情链接:https://build.nvidia.com/nvidia/audio2face-3d
8、Meta 发布代码世界模型 CWM:具备沙箱推演能力的32B AI
Meta 推出的 Code World Model (CWM) 是一个拥有 32B 参数 的 AI 系统,能够通过沙箱环境进行代码模拟和推演,从而减少错误并提高调试效率。该模型对硬件要求极高,需要双 H100 GPU 和 RDMA 技术支持。
【AiBase提要:】
🧠 CWM 在生成代码前会进行沙箱模拟,预测代码运行后果。
🔍 能快速定位代码错误,提升调试效率。
🚨 可在执行命令前预警潜在风险,增强安全性。
详情链接:https://github.com/facebookresearch/cwm
(举报)