AI热点 4月前 204 阅读 0 评论

全双工实时音视频交互、毫秒级响应,商汤“日日新”大模型交互平台接入小米 AI 眼镜

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 8 月 6 日消息,据商汤科技消息,作为小米长期生态合作伙伴,商汤“日日新”大模型交互平台“商量”已探索性接入小米 AI 眼镜,帮助用户在生活与工作的真实场景中,实现“看、说、记、想”一体化,具备全双工实时音视频交互能力。

据官方介绍,传统智能设备的交互体验,常受限于响应延迟、语境断裂与单向输入。小米 AI 眼镜 × 商汤日日新组合的亮点之一,在于其全双工实时音视频交互能力。这并非简单的语音指令接龙或“一问一答”的半双工拼接,而是构建了类似人与人对话的自然、流畅、不间断的交互闭环,例如逛街逛展进行实时识别,化身问答小百科;出国旅游又能成为翻译助手,在这些场景均展现了强大的实力:

  • 毫秒级响应,思考即交流:依托“日日新”强大的模型推理能力与底层优化,交互延迟被压缩至毫秒级,用户言语未落,理解已经开始,回应几乎实时生成。

  • 语境连续不中断:“日日新”大模型能深度理解上下文,精准跟踪对话脉络,支持随时打断、纠偏和深入追问,对话如同与真人助手般自然流畅。

  • 复杂环境反馈超稳定:即使在嘈杂的展馆人潮或喧闹的街头,其抗噪性能升级也能确保指令被精准捕捉、理解无误。

  • 深度分析,记忆加持:结合音视频记忆与检索技术,系统能即时关联历史沟通细节(如在向客户复述方案时),提供极具针对性的信息支持。

商汤科技称,此次合作为智能眼镜乃至更广泛的下一代智能硬件交互范式,提供了具备高价值的参考方向 —— 让 AI 更实时、更深层地融入人类感知与交互,持续释放其赋能用户创造价值的潜力。

据IT之家了解,今年 6 月,小米首款 AI 眼镜正式问世,被定义为“面向下一代的个人智能设备”,也是“随身的 AI 入口”。据 XR Vision 报道,小米 AI 眼镜首销 3 天销量或已接近 5 万副,创下了中国 AI 眼镜最快销售纪录。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!