本文主要是介绍3.语音增强短时谱估计算法——功率谱减法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
谱减法有两种实现方法:幅度谱减法与功率谱减法,在该专栏之前的文章中,已经介绍了幅度谱减法的原理,本篇文章将针对于功率谱减法进行介绍(使用的参数与幅度谱减法的参数意义一致)。
假设语音信号与噪声信号不想管,带噪语音信号的功率谱如下:
由于噪声平稳,假设发声前与发生期间的噪声功率谱相同,可利用发音前后的、没有语音只有噪声的“寂静帧”来估计噪声。然而语音是非常稳定的,实际上只能利用一小段加窗信号进行分析,用下式表示:
式中*表示复共轭,由于d(n)和s(n)互不相关,则互谱的统计均值为0,所以原始语音的功率谱估值如下所示:
当以上差值为负时,则结果令为0。
带噪语音的相位直接与
相乘,可以得到增强后的语音信号:
功率谱减法的原理框图如下所示:
我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=1yqgrvpm3ge84
这篇关于3.语音增强短时谱估计算法——功率谱减法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!