AI热点 9月前 • 243 阅读 • 0 评论

LeVo – 腾讯AI实验室推出的AI唱歌模型

作者头像

AI技术专栏作家 | 发布了 246 篇文章

LeVo是什么

LeVo是腾讯AI实验室推出的AI唱歌模型，具备强大的音色克隆能力，仅需3秒音频即可精准复制目标音色，包括音调、情感和韵律，无需大量训练数据。LeVo支持分轨生成，可分别生成人声和伴奏音轨，为后期编辑提供便利。技术架构基于语言模型（LM），结合LeLM和音乐编解码器，能并行生成音轨，音质表现接近行业领先水平，在歌词对齐能力上表现卓越。

LeVo的主要功能

零样本音色克隆：仅需3秒音频片段即可精准复制目标音色，包括音调、情感和韵律，无需大量训练数据。
分轨生成：LeVo支持双轨生成模式，可分别生成人声和伴奏音轨，为后期混音和编辑提供了更大灵活性。
高保真音乐表现：LeVo在音质表现上接近行业领先水平，尤其在音乐性、人声与伴奏和谐度和音质（MOS评分）等方面表现出色。通过多偏好对齐方法优化生成结果，确保音乐在各种风格和场景下都能保持高保真效果。

LeVo的技术原理

语言模型架构：LeVo采用语言模型（LM）架构，结合LeLM和音乐编解码器，能并行生成高质量的音乐作品。

LeVo的性能表现

在多项关键指标上可媲美行业领先的Suno4.5。
在歌词对齐能力（LYC）上，LeVo比Suno4.5高出0.21分，展现出卓越的文本控制能力。

LeVo的项目地址

项目官网：https://levo-demo.github.io/

LeVo的应用场景

个人音乐创作者：为热爱音乐创作但缺乏专业技能的个人用户提供低门槛、高质量的音乐创作平台。
专业音乐制作人：分轨生成功能和高保真音乐表现能够提升创作效率和质量。
音乐教育机构：可用于为学生提供生动、有趣的音乐教学体验。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

4月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

4月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

4月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

4月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

4月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

4月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

4月前 • AI热点

热门标签

安全超级智能 AI产品应用 GPT-4o多模态画图无畏契约集锦图生视频 AI代码生成如何辨别AI生成的图片文字声音民意调查 AI练习题印度市场

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝