2025-12-25 15:25:34

通义千问发布Qwen3-TTS:多音色多语种语音合成新突破

摘要
12月10日,通义千问推出全新语音合成模型Qwen3-TTS,该模型具备多音色、多语种及多方言的语音生成能力,现已通过Qwen API向用户开放使用

通义千问发布Qwen3-TTS:多音色多语种语音合成新突破

12月10日,通义千问推出全新语音合成模型Qwen3-TTS,该模型具备多音色、多语种及多方言的语音生成能力,现已通过Qwen API向用户开放使用。

在音色表现方面,Qwen3-TTS提供超过49种声音选择,覆盖不同性别、年龄、地域特征以及多样化角色设定。其中包括如活泼俏皮的茉兔、邻家女孩般的小野杏、性格直率的十三、严肃认真的墨讲师、沉稳睿智的沧明子以及可爱灵动的萌小姬等特色音色,满足多样化场景需求。

在语言支持上,模型可流畅生成中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语和俄语共十大语言,其在国际多语言语音测试集上的平均词错误率优于多个主流同类系统,展现出更强的语言识别与发音准确性。同时,在方言还原方面也实现进一步提升,支持包括普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话在内的多种地方语言形式,精准呈现各地口音特点与语言韵味。

此外,Qwen3-TTS在语音自然度方面取得显著进步,相较前代模型,能够更智能地根据上下文内容自适应调整语速与语调节奏,使输出语音在韵律变化上更为流畅,整体表达更具情感层次,拟人化效果接近真人发声水平。

科技趋势
时事资讯
回顶部