AI热点 10小时前 62 阅读 0 评论

AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://app.aibase.com/zh

1、阿里夸克发布AI创作平台“造点”,通义万相Wan2.5生成视频7天免费

阿里夸克发布AI创作平台“造点”,整合了通义万相Wan2.5和Midjourney V7,支持音画同步视频生成及高级图像创作功能,同时为普通用户提供便捷的AI创作工具。

【AiBase提要:】

🎥 集成通义万相Wan2.5,支持音画同步视频生成。

🎨 引入Midjourney V7,提供多图参考与风格代码等高级功能。

📱 提供轻量化创作体验,满足普通用户日常修图与创意需求。

2、Wan2.5-Preview 发布,实现多模态输入与电影级视频同步生成

Wan2.5-Preview 的发布标志着 AI 视觉生成技术进入了一个新的阶段,其强大的多模态能力和精确的控制功能,将为开发者和创作者提供前所未有的工具。

【AiBase提要:】

🎥 视频生成支持高保真、高一致性的视听同步,可生成多人声、音效和BGM。

🎨 图像生成能力提升,能生成逼真图像、多样的艺术风格及专业图表。

🔄 支持对话式、基于指令的图像编辑,实现像素级精度操作。

3、可灵AI推出最新视频生成模型可灵2.5Turbo 并宣布较之前版本降价近30%

近日可灵 AI 正式推出了其最新的视频生成模型 —— 可灵2.5Turbo,并宣布较之前版本降价近30%。此次降价策略成为可灵 AI 的一大卖点,显现出厂商在视频大模型订阅价格上的分化。

【AiBase提要:】

🎥 可灵AI推出了最新的视频生成模型可灵2.5Turbo,并宣布价格下降近30%。

💰 可灵AI的定价体系包括多个层次,基础会员仅需66元,而最高级别会员月费为1314元。

📈 可灵AI是唯一公开披露营收的大模型厂商,二季度营收已超过2.5亿元。

4、阿里通义推出 Qwen3-ASR-Toolkit,实现音视频转录新突破

阿里通义Qwen团队推出了Qwen3-ASR-Toolkit,一款开源的Python命令行工具,能够实现小时级的音视频转录。该工具基于最新的Qwen3-ASR-Flash模型,支持多种音视频格式,并具备智能静音切分、多线程并行上传等功能,显著提升了转录效率和准确性。

【AiBase提要:】

🎧 突破三分钟限制,支持小时级音视频转录。

🧠 基于Qwen3-ASR-Flash模型,确保高准确率语音识别。

🔄 支持多种音视频格式,提升转录灵活性与效率。

详情链接:https://github.com/QwenLM/Qwen3-ASR-Toolkit

5、谷歌相册AI编辑革命来袭:安卓用户动动嘴就能P图,Pixel 10独占功能全面开放

谷歌推出的AI编辑功能,通过自然语言交互让安卓用户轻松编辑照片,解决了传统修图的复杂性问题。该功能从Pixel 10设备扩展到所有安卓用户,提升了移动摄影体验,并支持光线调整、背景移除等高级操作。

【AiBase提要:】

🤖 谷歌推出AI编辑功能,让用户通过自然语言指令轻松编辑照片。

📷 功能覆盖广泛,包括光线调整、背景移除和老照片修复等高级操作。

🌐 谷歌推动AI透明度,支持C2PA内容凭证以维护信息真实性。

6、谷歌推出 Mixboard:让创意设计更轻松的 AI 工具

谷歌推出了一款名为 Mixboard 的实验性工具,旨在帮助用户快速创建情绪板,探索和实现设计灵感。该工具支持模板和文本提示,并允许用户通过上传图片或自然语言描述生成视觉效果,适用于家居装饰、活动策划等多种场景。此外,它还支持一键再生和图像编辑功能,提升设计效率。

【AiBase提要:】

🎨 Mixboard 是谷歌新推出的 AI 工具,帮助用户快速创建个性化情绪板,支持模板和文本提示。

🖌️ 用户可以通过上传图片或使用自然语言生成视觉内容,适用于家居装饰和活动策划。

🔄 工具支持一键再生和图像编辑,提升了创作过程中的灵活性和便利性。

详情链接:https://labs.google.com/mixboard/welcome

7、Qwen 发布全新 AI 模型 Qwen3-Max:不仅能写代码,还能自主思考

Qwen 团队推出了全新的 AI 模型 Qwen3-Max,该模型在多个基准测试中表现出色,特别是在代码生成和智能体能力方面。Qwen3-Max 的参数规模庞大,并采用了先进的 MoE 结构设计,提升了训练效率和稳定性。此外,Qwen3-Max-Instruct 和 Qwen3-Max-Thinking 也展现了卓越的性能,为开发者提供了强大的工具。

【AiBase提要:】

🧠 Qwen3-Max 模型参数超过1万亿,预训练使用了36万亿个 tokens。

💻 Qwen3-Max-Instruct 在编程基准测试中取得优异成绩,展示了其在实际编程中的能力。

🧮 Qwen3-Max-Thinking 在数学推理测试中取得满分,证明了其强大的推理能力。

8、Figma MCP服务器重磅升级!一键设计转代码,设计师与前端告别“翻译”时代

Figma推出的MCP服务器彻底改变了设计与开发的协作方式,通过标准化协议让AI模型直接读取设计文件的语义层信息,无需依赖客户端。这不仅提升了开发效率,还实现了设计系统与前端开发的深度融合。

【AiBase提要:】

✅ 远程访问功能让AI模型直接读取设计文件的语义层信息,无需截图或手动描述。

🔄 与Figma Make无缝集成,支持从Make文件提取资源并转化为代码级资产。

⚡ Code Connect UI组件映射优化,提升AI生成代码的还原度,缩短开发时间60%-80%。

详情链接:https://127.0.1:3845/sse

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!