Qwen3-TTS
github地址:https://github.com/QwenLM/Qwen3-TTS
Qwen3-TTS是通义千问团队开发的开源语音合成模型系列,支持多音色、多语种与多方言的语音生成
懒人包界面
注意,建议显存8GB以上
使用方式
下载并解压懒人包,点击一键启动WebUi.bat
等待终端执行
执行成功后会自动打开网页
网页为https,因为证书问题,需要点击高级,运行,才能正常访问界面
本文只演示声音设计
比如声音描述为甜美的萝莉音或者可爱的小孩音,都行,声音会按描述的内容生成
生成后可以点击试听或者下载
目前语音克隆和自定义音色请自行测试
Tips
点击此处 网盘下载
可以由stable difftion webui生成人像图片
然后Qwen3-TTS生成要说的语音内容
再soulX-FlashHead把图片和语音生成数字人视频
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦




