gantts专题

深入浅出讲解语音合成一:merlin、Gantts及其前端处理

文字转语音(TTS)是一个给定文字输入,生成语音波形的系统。本系列文章将从传统的语音合成方法,到近期的端到端合成方案,各类型的声码器(个人认为比较有潜力的部分)进行讲解,作为近期实习结束后的工作总结。 语音合成过程分为前端的文本处理,中端的模型训练和后端的声码器合成过程。 在传统语音合成方法中,前端处理的过程是非常麻烦的。首先,作为训练语料的文本需要转换为神经网络能够识别的数字特征,所以诞