本文主要是介绍强大的EmotiVoice:易魔声 : 多音色提示控制TTS,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
EmotiVoice提供一个易于使用的web界面,还有用于批量生成结果的脚本接口。
gitee镜像:https://gitee.com/mirrors/EmotiVoice
MAC下有一键安装包
可以用docker
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
完整安装
conda create -n EmotiVoice python=3.8 -y conda activate EmotiVoice pip install torch torchaudio pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict
可以看到这是用到了torch和transformers
准备模型
git lfs install git lfs clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese
或者
git clone https://www.modelscope.cn/syq163/WangZeJun.git
这篇关于强大的EmotiVoice:易魔声 : 多音色提示控制TTS的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!