AI热点 4月前 132 阅读 0 评论

脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 6 月 16 日消息,据外媒 New Atlas 14 日报道,脑机接口技术迎来一项重大突破:加州大学戴维斯分校研发的新型植入系统,让一位瘫痪患者不仅能顺畅说话,甚至还能借助电脑“哼唱”旋律,几乎没有任何延迟。

研究团队在一位渐冻症患者身上试验了这项技术。通过在大脑中控制发音的区域植入四组微电极阵列,系统能实时捕捉说话时产生的神经信号,再结合低延迟处理和 AI 解码模型,将这些信号同步转化为语音,在扬声器中播放。

需要强调的是,这项技术并不是在“读心”,而是识别出患者尝试发声时大脑发出的运动指令。系统合成出的声音与患者本人极为相似 —— 这得益于在其发病前录制的语音样本训练出的声音克隆算法。

从信号采集到语音生成,全程只需 10 毫秒,几乎可以实现实时对话。

系统还能识别出患者试图唱歌的动作,判断其想表达的音高,并据此合成旋律。在研究团队发布的视频中,这一功能尚显初级,但对于那些逐渐失去表达能力的人来说,无疑是一种重获声音的希望。

该研究论文的资深作者 Sergey Stavisky 表示,这一进展为脑机语音合成带来了转折点。他说:“借助即时语音输出,神经义体用户能真正参与对话 —— 他们可以打断别人,也更不容易被别人误打断。

该系统能复现“啊”“喔”“嗯”等语气词,判断句子是疑问还是陈述,甚至辨别出强调词语的位置。研究团队还指出,系统能准确合成此前从未见过的虚构词语。这使得语音表达更自然、更具表现力。

IT之家从报道中获悉,研究人员也指出,目前试验仅在一位患者身上进行,下一步将拓展至其他因不同原因丧失语言能力的人群,以验证技术的普适性。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!