AI热点 2月前 84 阅读 0 评论

速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


图片来源:Palabra


一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。


如今,LLMs 使文本语言转换变得更容易,但 Reddit 联合创始人亚历克西斯·奥哈尼安指出,语音翻译并非如此简单。


奥哈尼安表示:"AI 可以生成内容和翻译文本。但[语音]翻译是个独特难题,因为它需要实时语言切换,同时声音还需保持拟人化。"


奥哈尼安及其风投公司 Seven Seven Six(776)认为 Palabra AI 可能解决这一难题。因此该公司领投了这家初创企业 840 万美元的种子前轮融资。


本轮参投方还包括 Creator Ventures 及多位个人投资者,如 Instacart 联合创始人马克斯·穆伦、a16z 前合伙人安妮·李·斯凯茨、DeepMind 前产品主管迈赫迪·吉萨西以及纳马特·巴哈拉姆。


Seven Seven Six 的奥哈尼安特别强调,Palabra 在产品执行与团队专业性的双重优势促使他们决定投资。


“Palabra 的翻译层运行非常流畅。该公司拥有一支强大的 AI 研究团队,在语音领域做了高质量的工作。此外,这家初创公司在产品设计和输出质量方面也做出了出色的选择,”他补充道。


Palabra 由 Artem Kukharenko 和 Alexander Kabakov 于 2023 年创立。曾担任三星机器学习工程师的 Kukharenko 表示,他作为数字游民曾在多个国家生活,遇到过语言障碍问题。因此他希望结合自己的机器学习经验来解决实时翻译难题。


首席执行官ARTEM KUKHARENKO



图片来源:Palabra


"许多其他公司都曾尝试解决翻译难题。但当他们将语音转文本、文本转语音等 API 与翻译技术结合使用时,延迟时间就会增加,翻译效果无法实现真正的实时性。而通过 Palabra,我们成功将延迟降至 800 毫秒,使翻译过程流畅无缝,真正实现实时翻译。"他在电话采访中向 TechCrunch 表示。


Kukharenko 补充道,该公司已构建了一条定制化数据管道,使这家初创企业能在数周内轻松新增语言支持。他表示在管道末端,Palabra 会安排人工译员对输出质量进行校验。该初创公司称其算法还能适应嘈杂环境和对话中断等不同场景。


Palabra AI 同时提供面向消费者和企业的翻译产品。该公司推出的桌面应用程序兼容 Mac 和 Windows 系统,可与 Google Meet、Zoom、Discord、Slack 及 Microsoft Teams 等主流视频通话软件协同工作。该应用支持超过 30 种语言的实时互译,用户可选择以目标语言收听对方的母语发言,这一功能在多国籍参与者通话场景中尤为实用。


Palabra 官网表示,其桌面应用即将为 YouTube、Netflix、Twitch 和 Vimeo 等内容网站提供原生翻译功能。


用户每月可免费获得30分钟翻译时长。如需更多额度,可订阅每月25美元起的套餐,获得60分钟跨应用翻译时长。


该初创公司向企业提供 API 和 SDK,以便将翻译功能集成至其产品中。


目前其技术已为Agora 等视频平台提供实时多语言流支持。此外,GIS Group 等语言服务提供商正将 Palabra 工具与人工翻译结合使用。该公司表示,多家活动主办方也采用其技术提供多语言流服务。


Palabra 在翻译市场面临激烈竞争。在消费者端,像 Y Combinator 投资的 EzDubs 这样的初创公司正在开发适用于面对面或电话对话的应用程序。今年早些时候,谷歌也推出了 Meet 视频通话的实时翻译功能 。在企业端,像迪拜的 Camb.AI 这样的初创公司正在开发多语言直播活动翻译技术。


为了脱颖而出,Palabra 目前正在开发新的流式预测模型,有望大幅降低延迟。该公司还致力于支持超过 10,000 个同步音频流的翻译处理。


参考资料


https://techcrunch.com/2025/08/14/ai-translation-tech-palabra-gets-backing-from-reddit-co-founders-venture-firm/


文章来自于微信公众号“Z Potentials”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!