阿里通义语音双模型发布：一句话即可自由生成

凤凰网科技讯 3月2日，阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3.5与Fun-AudioGen-VD。

官方宣称，无论是精细控制声音表达，还是从零设计音色与场景，都可以通过自然语言指令直接生成。

其中，Fun-CosyVoice3.5应用方向为多语种复刻+精细化表达控制：用户可以直接用自然语言描述表达方式，例如：“语气坚定一点”、“稍微压低音调，语速慢一点”、“带一点情绪起伏”...... 模型即可理解并生成相应表达。此外，针对生僻字、复杂语句等容易读错的场景专项优化，Fun-CosyVoice3.5生僻字读错率从15.2%降至5.3%，

Fun-AudioGen-VD则主打声音设计+场景化音频生成。支持根据自然语言描述，生成目标音色、情绪表达和完整听觉场景，此外，Fun-AudioGen-VD不仅能生成声音，还能生成声音所处的“世界”，打造沉浸式听觉场景。

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8rA71aYdBr4

阿里通义语音双模型发布：一句话即可自由生成

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享1 个月前

小同爱分享4 个月前

最新文章

阅读TOP榜

标签

链接

搜索

您还没有登录

阿里通义语音双模型发布：一句话即可自由生成

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享1 个月前

小同爱分享4 个月前

最新文章

阅读TOP榜

标签

链接

搜 索

感谢您的打赏

分享文章

搜索