凤凰网科技讯 12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。

其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。


本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8oyUGhvAILE

小同爱分享16 小时前
学习就学习为什么还考试?怎么人与人之间,连一点信任都没有? - 小同爱分享
小同爱分享1 天前
你总盼着遇贵人,贵人不曾记得你,因为贵人多忘事。 - 小同爱分享