AI热点 9小时前 149 阅读 0 评论

ChatGPT 负责人坦言:GPT-5 仍有“幻觉”问题,建议用户核对答案

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 8 月 17 日消息,尽管 ChatGPT 已经推出了新的 GPT-5 模型,但其仍然存在出错的可能性。OpenAI 的一位高级高管本周再次强调了这一点。OpenAI ChatGPT 负责人尼克・特利(Nick Turley)在接受 The Verge 的 Decoder 播客采访时指出:“在可靠性方面,可靠和完全可靠之间存在很大的不连续性。”他进一步解释道:“除非我们能够证明在所有领域,而不仅仅是某些领域,ChatGPT 比人类专家更可靠,否则我们会继续建议你仔细核对答案。”

特利称:“我认为人们会继续将 ChatGPT 作为第二种参考意见,而不一定将其作为主要事实来源。”

然而问题在于,人们很容易就直接接受聊天机器人的回答,但生成式人工智能工具(不仅仅是 ChatGPT)往往有“幻觉”问题,即编造信息。这是因为它们主要是基于训练数据中的信息来预测查询的答案,而没有对事实的明确理解。

据IT之家了解,尽管 AI 在猜测方面表现不错,但归根结底,它们仍然只是在猜测。特利承认,当与传统搜索引擎或公司内部特定数据等能够更好地掌握事实的工具结合使用时,该工具表现最佳。他说道:“我仍然坚信,毫无疑问,正确的产品是将大型语言模型与事实真相相结合,这也是我们将搜索功能引入 ChatGPT 的原因,我认为这带来了巨大的改变。”

特利表示,GPT-5 在减少“幻觉”方面取得了“巨大进步”,但距离完美仍有很长的路要走。他说道:“我相信我们最终会解决‘幻觉’问题,但我也相信我们不会在未来一个季度内解决这个问题。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!