AI热点 7小时前 143 阅读 0 评论

AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://app.aibase.com/zh

1、智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网

智谱AI推出的AutoGLM 2.0是一款具有划时代意义的AI代理产品,它通过强大的自然语言理解和多平台操作功能,实现了用户与数字世界的无缝交互。从点外卖到订机票,再到社交媒体内容创作和办公自动化,AutoGLM 2.0展示了其在提升生活和工作效率方面的巨大潜力。

视频来自官方

【AiBase提要:】

🤖 AutoGLM 2.0具备强大的自然语言理解能力,能够执行复杂的跨平台任务。

📊 它支持多个主流应用平台,实现自动化操作,极大提升了用户体验。

🌐 开放API接口,使AutoGLM 2.0可以融入各种智能设备,推动智能化生活的普及。

详情链接:https://autoglm.zhipuai.cn/htdocs/download.html

2、腾讯元宝接入腾讯视频 点击可直接跳转观看

腾讯元宝与腾讯视频合作,用户可通过元宝平台直接跳转至腾讯视频观看影视作品,极大提升了观影便捷性。

【AiBase提要:】

🎥 用户可在腾讯元宝平台直接搜索并跳转至腾讯视频观看影视作品。

🔍 元宝支持通过片名、情节或台词快速检索影视内容。

💬 用户可与元宝探讨影视作品的创作背景和剧情内涵。

3、字节跳动发布开源大语言模型 Seed-OSS,助力开发者与研究者

字节跳动的 Seed 团队推出了 Seed-OSS 系列开源大型语言模型,专注于长文本理解、推理能力和开发者友好特性。Seed-OSS-36B 模型拥有360亿参数和512K的上下文处理能力,适用于学术研究和实际开发任务。

【AiBase提要:】

🧠 Seed-OSS 系列模型基于因果语言模型架构,支持长文本理解和推理能力。

⚙️ 提供两种版本:Seed-OSS-36B-Base 和 Seed-OSS-36B-Base-woSyn,满足不同需求。

🚀 支持灵活的“思考预算”控制,提升推理效率并优化推理任务表现。

详情链接:https://github.com/ByteDance-Seed/seed-oss

4、速卖通“新品闪电推”亮相:AI Agent自动整合资源,新品7天破零率翻倍

速卖通推出的‘新品闪电推’AI Agent通过自动化和智能化的营销策略,帮助商家快速实现新品出单。该工具能够自动整合平台内外资源,并匹配最佳推广策略,显著提升了新品转化率。

【AiBase提要:】

🔥 新品闪电推通过AI技术提升新品出单效率。

💡 AI自动整合资源并制定最佳推广策略。

📈 自上线以来,新品7天破零率翻倍,效果显著。

5、微软测试Windows11 Copilot新功能:AI智能搜索文件和图片

微软正在为Copilot应用引入AI驱动的智能文件搜索功能,允许用户通过自然语言描述进行文件检索。该功能基于AI技术,提升了文件管理效率,并扩展了AI在操作系统中的应用范围。

【AiBase提要:】

✨ 引入自然语言描述搜索功能,提升文件检索体验。

🖼️ 新增家庭体验界面,展示最近使用的应用、文件和对话记录。

🖼️ 支持图片分析功能,实现多媒体内容交互。

6、Liquid AI 推出 LFM2-VL:低延迟的超高效视觉语言模型

Liquid AI 发布了 LFM2-VL 系列,这是一种专为低延迟和设备适应性部署优化的视觉语言基础模型。该系列包括两个高效的变体:LFM2-VL-450M 和 LFM2-VL-1.6B,分别适用于资源受限环境和高端移动设备。其 GPU 推理速度比现有模型快两倍,并在图像描述、视觉问答等任务上保持竞争力。

【AiBase提要:】

🚀 LFM2-VL 提供超高效的 GPU 推理速度,比现有模型快两倍,适合各种设备使用。

🖼️ 支持原始分辨率处理图像,确保大图像细节不失真。

📦 两种模型均为开放权重,可在 Hugging Face 上下载,适合研究和商业应用。

详情链接:https://huggingface.co/collections/LiquidAI/lfm2-vl-68963bbc84a610f7638d5ffa

7、OpenAI 首次突破月收入10亿美元,算力需求依然紧张

OpenAI 在财务和算力方面面临挑战,但其业务规模迅速扩大,并与多家科技公司展开合作以应对计算资源需求。

【AiBase提要:】

🧠 OpenAI 首次实现月收入突破10亿美元,但算力需求持续紧张。

🤝 与微软的紧密合作推动 AI 产品快速发展。

🚀 最新推出的 ChatGPT-5 引发广泛关注,订阅量加速增长。

8、谷歌Pixel10抢跑AI赛道:搭载情感识别功能,领先苹果两年布局智能手机未来

谷歌在Pixel10系列中全面升级了AI功能,包括Gemini Live的语音识别、Magic Cue主动助手、Camera Coach摄影辅助以及突破性的语音翻译功能。这些创新展示了谷歌在AI驱动智能手机领域的领先地位。

【AiBase提要:】

🌟 Pixel10系列搭载Tensor G5处理器,支持最新Gemini Nano模型,实现AI能力的质的飞跃。

💡 Magic Cue功能通过AI提供上下文建议,重新定义用户交互体验。

🌐 语音翻译功能支持多种语言互译,为商务和旅行用户提供便利。

9、谷歌Pixel Buds震撼升级:AI手势控制引领耳机革命,130美元就能拥有降噪黑科技

文章详细介绍了谷歌最新发布的Pixel Buds2a和Pixel Buds Pro2耳机,这两款产品在AI技术、功能升级和用户体验方面均有显著提升。特别是Pixel Buds Pro2的AI手势控制和自适应音频功能,展现了谷歌在智能音频设备领域的创新能力。

【AiBase提要:】

🎧 Pixel Buds2a首次引入主动降噪技术,提升了通话清晰度和用户体验。

🧠 Pixel Buds Pro2支持AI手势控制,实现更便捷的交互方式。

💡 新增的自适应音频和大音量保护功能,进一步优化了用户的听觉体验。

10、ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色

ElevenLabs 推出的 v3 Alpha API 是一款突破性的文本转语音工具,支持超过 70 种语言,并具备对话模式和高级音频标签功能,为开发者提供了更自然、富有情感的语音生成能力。

【AiBase提要:】

🌟 支持超过 70 种语言,实现多语言语音生成。

🎭 引入对话模式,支持多角色互动和语气变化。

🔊 高级音频标签功能,精确控制语音情感与节奏。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!