文本转语音

OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音

AI 语音技术领域迎来重要进展,Fish Audio 宣布开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini。作为广受好评的 S1模型的精简版,S1-Mini 以其轻量化设计、高表现力和多语言支持引发行业热议。技术亮点:轻量化与高性能兼得OpenAudio S1-Mini 是从4B 参数的 S1模型蒸馏而来的轻量化版本,仅包含0.5B 参数,大幅降低计算需求,适合在资源受限的环

Fish Audio推出OpenAudio S1:200万小时数据驱动的超自然语音模型

Fish Audio,一家专注于AI音频技术的领先企业,于2025年6月3日正式推出了其最新文本转语音(TTS)模型——OpenAudio S1。这一模型以其高度自然的语音输出和卓越的情感表现力,为语音生成技术树立了新标杆,旨在为开发者与企业提供高性能且成本效益优越的解决方案。突破性的规模与性能OpenAudio S1基于超过200万小时的音频数据集训练,能够精准捕捉多样的语言风格、口音及情感表达

Resemble AI开源TTS Chatterbox ,性能直逼超越ElevenLabs

近年来,文本转语音(TTS)技术在人工智能领域的应用日益广泛,从智能助手到内容创作,TTS正在重塑我们与声音交互的方式。一款名为Chatterbox的开源TTS模型横空出世,凭借其卓越的性能和创新功能,迅速成为行业焦点。Chatterbox:开源TTS的革命性突破Chatterbox由Resemble AI开发,基于MIT许可证完全开源,允许开发者自由使用和修改。这款模型基于0.5B规模的LLaM

ElevenLabs推出V3声音模型:支持70多种语言,可通过标签控制情感、语气

全球领先的 AI 语音技术公司 ElevenLabs 正式发布了其最新文本转语音模型 Eleven v3(Alpha 版),被誉为迄今最具表现力的 AI 语音模型。这一突破性进展不仅提升了语音合成的自然度和情感表达能力,还为内容创作者和开发者提供了更强大的工具,助力视频、音频书和多媒体工具的开发。技术突破:更自然的对话与情感表达Eleven v3引入了全新的架构,能够更深入地理解文本语义,显著提升

Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代!

法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。这款高度模块化的语音模型以其智能对话、超低延迟和个性化定制功能引发业界热议。AIbase 综合整理最新信息,带您深入了解 Unmute 的技术突破与应用前景。模块化设计:为任何文本模型“加声”Unmute 的核心亮点在于其高度模块化的架构。开发者无需重新训练模

地表最强AI语音来了!Eleven v3 Alpha版震撼发布,会说话还能“演戏”

随着人工智能技术的飞速发展,文本转语音(TTS)领域迎来了新的里程碑。2025年6月5日,ElevenLabs正式推出其最新文本转语音模型 Eleven v3(Alpha版),被誉为“地表最强”的TTS模型。这款模型不仅能将文本转化为自然流畅的语音,还能通过精准的情感控制和多语言支持,模拟真实对话中的语气变化与非语言表达,为创作者和开发者提供了前所未有的语音生成体验。以下是AIbase对Eleve