2025-12-25 12:42:49

面壁智能发布VoxCPM 1.5:音频质量与生成效率双提升

摘要
12月10日,面壁智能宣布VoxCPM 1 5版本正式发布。此次更新在持续优化开发者使用体验的基础上,实现了多项核心性能的提升。VoxCPM是一款

12月10日,面壁智能宣布VoxCPM 1.5版本正式发布。此次更新在持续优化开发者使用体验的基础上,实现了多项核心性能的提升。

VoxCPM是一款参数规模为0.5B的语音生成基础模型,最早于今年9月推出。本次发布的1.5版本在音频质量、生成效率和开发灵活性方面均有显著改进。

主要更新包括:音频克隆能力得到增强,AudioVAE的采样率由16kHz提升至44.1kHz,能够基于高质量音频样本生成更加逼真、细节更丰富的语音;生成效率实现翻倍,在模型参数略有增加的情况下,仅需6.25个token即可生成1秒音频,相较前代在速度不变的前提下进一步提升了音质;对开发者支持更为完善,新增LoRA及全量微调脚本,便于用户进行深度定制化训练;同时加强了生成稳定性,有效减少音频伪影,改善了长文本语音合成的表现。

目前,VoxCPM 1.5版本已在Github与Hugging Face平台开放开源,供社区使用与协作。

科技趋势
时事资讯
回顶部