英伟达开源 Audio2Face 模型：AI 实时生成面部动画，多语言口型同步

AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 9 月 25 日消息，英伟达昨日（9 月 24 日）发布博文，宣布开源生成式 AI 面部动画模型 Audio2Face，涵盖模型、软件开发工具包（SDK）及完整训练框架，希望能在游戏和 3D 应用中，加速开发 AI 智能虚拟角色。

该技术通过分析音频中的音素、语调等声学特征，实时驱动虚拟角色面部动作，生成精准的口型同步和自然的情感表情，可广泛应用于游戏、影视制作和客户服务等领域。

Audio2Face 支持两种运行模式：预录制音频的离线渲染和动态 AI 角色的实时流式处理。IT之家援引博文介绍，英伟达此次开源了多个核心组件：

Audio2Face SDK
适用于 Autodesk Maya 的 2.0 版本本地执行插件
Unreal Engine 5.5 及以上版本的 2.5 插件
回归模型（v2.2）
扩散模型（v3.0）
开源训练框架支持开发者使用自有数据微调模型，以适应特定应用场景。

该技术已获行业广泛采用。游戏开发商 Survios 在《异形：侠盗入侵进化版》（Alien: Rogue Incursion Evolved Edition）中集成 Audio2Face，大幅简化了口型同步与面部捕捉流程。

Farm 51 工作室也将其用于《切尔诺贝利人 2：禁区》（Chernobylite 2: Exclusion Zone），通过音频直接生成细腻面部动画，节省大量制作时间，提升角色真实感和沉浸体验。创新总监 Wojciech Pazdur 称此为“革命性突破”。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

登录账号

英伟达开源 Audio2Face 模型：AI 实时生成面部动画，多语言口型同步

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

速抢（2核2G）77元/年香港免备案服务器

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

登录账号

英伟达开源 Audio2Face 模型：AI 实时生成面部动画，多语言口型同步

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线 作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

速抢（2核2G）77元/年香港免备案服务器

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

AI前线作者