kaldi 中run_ivector_common.sh 在使用GMM-HMM对音频和文本进行对齐之后,在使用DNN网络的时候,kaldi中会加入说话人信息,一般用ivector特征,kaldi中run_ivector_common.sh 对特征做了进一步的处理: 对特征进行速度上的扰动处理 # perturb the normal data to get the alignment _sp
本翻译仅供自己学习使用,不承担任何其他责任。水平有限拒绝转载。欢迎大家指出错误,共同学习。 我们假设本页的读者了解使用HMM-GMM进行语音识别的基础知识。在这里我们需要在线简明介绍的是:M. Gales and S. Young (2007).``The Application of Hidden Markov Models in Speech Recognition."