AI热点 3月前 204 阅读 0 评论

LeVo – 腾讯AI实验室推出的AI唱歌模型

作者头像

AI技术专栏作家 | 发布了 246 篇文章

LeVo是什么

LeVo是腾讯AI实验室推出的AI唱歌模型,具备强大的音色克隆能力,仅需3秒音频即可精准复制目标音色,包括音调、情感和韵律,无需大量训练数据。LeVo支持分轨生成,可分别生成人声和伴奏音轨,为后期编辑提供便利。技术架构基于语言模型(LM),结合LeLM和音乐编解码器,能并行生成音轨,音质表现接近行业领先水平,在歌词对齐能力上表现卓越。

LeVo的主要功能

  • 零样本音色克隆:仅需3秒音频片段即可精准复制目标音色,包括音调、情感和韵律,无需大量训练数据。
  • 分轨生成:LeVo支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。
  • 高保真音乐表现:LeVo在音质表现上接近行业领先水平,尤其在音乐性、人声与伴奏和谐度和音质(MOS评分)等方面表现出色。通过多偏好对齐方法优化生成结果,确保音乐在各种风格和场景下都能保持高保真效果。

LeVo的技术原理

  • 语言模型架构:LeVo采用语言模型(LM)架构,结合LeLM和音乐编解码器,能并行生成高质量的音乐作品。

LeVo的性能表现

  • 在多项关键指标上可媲美行业领先的Suno4.5。
  • 在歌词对齐能力(LYC)上,LeVo比Suno4.5高出0.21分,展现出卓越的文本控制能力。

LeVo的项目地址

  • 项目官网:https://levo-demo.github.io/

LeVo的应用场景

  • 个人音乐创作者:为热爱音乐创作但缺乏专业技能的个人用户提供低门槛、高质量的音乐创作平台。
  • 专业音乐制作人:分轨生成功能和高保真音乐表现能够提升创作效率和质量。
  • 音乐教育机构:可用于为学生提供生动、有趣的音乐教学体验。
作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!