AI热点 21小时前 131 阅读 0 评论

腾讯混元首创交互式AI播客,能让用户买单吗

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

继8月上线AI播客功能,支持将文本、网页、文档一键转化为自然流畅的双人对谈等形式音频后,日前腾讯混元方面宣布推出国内首个交互式AI播客。支持用户在收听播客的过程中,随时打断主持人和嘉宾的发言,并通过语音或者打字的方式“举手”提问。

据腾讯混元方面介绍,基于大模型意图识别、长上下文理解、多轮对话和外部联网检索能力,交互式AI播客能够结合上下文以及背景信息,更准确地给出答案。目前用户使用电脑访问腾讯混元官网,点击首页对话框下方“AI播客”即可体验。

众所周知,在视频播客大咖云集的同时,AI播客也获得了越来越多的关注。除腾讯混元外,从海外的谷歌NoteBookLM到国内的字节豆包,都已经开始探索这一方向。所以如今推出号称国内首个交互式AI播客,腾讯混元显然是为了打出差异化这张牌,试图率先抢夺用户心智。

不可否认的是,腾讯混元选择的这一切入点颇为精准。在当下这个直播盛行的时代,用户与创作者的距离已经被无限拉近,互动也变得更方便,“用户共创”更是已经成为创作者讲故事的新方式。然而传统播客也好、新兴的视频播客也罢,都只能单向收听,无法进行实时互动。

但问题是腾讯混元推出的交互式AI播客,真的能满足用户的交互需求吗?要知道从读者来信到直播间发弹幕,不论互动方式如何演进,从渴望对话到喜欢创作者的个人风格,不管互动的目的归于何处,用户与创作者之间的互动仍是人与人之间的互动。

然而腾讯混元这一所谓的交互式AI播客,本质上依旧是用户在与AI互动。只不过在这个过程中,用户省去了打开另一个AI助手App的步骤,AI输出的也变成了语音。而且与用户对话的AI,其实是一个与创作者无关的AI。创作者产出的内容,在这场用户与AI的互动中扮演的不过是长下文、背景信息的角色。这也就意味着用户通过交互得到的答案,与创作者并无直接关联。

就好比当你向他人请教,希望借助后者的经验与智慧解答疑惑时,对方却帮你打开浏览器输入了问题,然后再当着你的面把搜索结果念出来。虽然答案可能没错,但显然大概率不够精彩。而且如果只能得到随处可见的“大路货”,那么用户又为什么要打断自己的收听体验呢?

总而言之,希望改变播客的交互方式来重塑、建立用户心智,或许是一个不错的创意,但想要让其落地,腾讯混元可能还需要继续探索。

事实上,面临质疑的不只是交互式AI播客,整个AI播客赛道都还有诸多难题需要解决。

例如,尽管相比以往的“听文章”功能,AI播客大多支持用户对播客风格、主持人数以及音色进行自主选择,使其更具可听性,但目前主流的AI播客产品逻辑,依旧是对既有内容的“照本宣科”,而这就自然就会牵扯到创作者的权益。当用户选择复制链接、交由腾讯混元生成播客,而不再浏览图文时,创作者又该如何从用户的“收听”中获得收益呢?

当然,目前市场也有来福这样不靠“照本宣科”,而是依赖AI生成内容的AI播客产品。而且这似乎还是一个“数据飞轮+内容平台”的故事,即用户听得越多,平台收集的数据就越多,所以能生成用户更爱听的内容。但问题是,AI真的能支撑起这个故事吗?

至少就目前而言,虽然在重信息传达,轻解读评论的新闻类播客中,AI有用武之地。但除了这类播客,无论是主打“博人一笑”的娱乐类,还是以“对话权威”为主的知识类播客,AI暂时都还很难有更多的作用,并达到能被听众喜爱、消费的标准。

说到底,用户想听的从来都不只是一段流畅的音频,而是一个个有趣的灵魂。而且就国内市场来说,视频播客也好、AI播客也罢,层出不穷的新概念背后,是播客始终没能变成一门大众生意的残酷事实。

【本文图片来自网络】

本文来自微信公众号 “三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!