梅尔倒专题

MFCC(梅尔倒频谱系数)总结

看了很多MFCC的资料,经常过一段时间就忘了。现在总结一下其中的要点,便于今后翻看。 MFCC(梅尔倒频谱系数)是在1980年由Davis和Mermelstein搞出来的。MFCC是一种人工(hand crafted)特征,可以用于语音识别等。当年在语音领域取得了重大的成就,后来出现了深度学习,这种deep learned特征就是另一说了。虽然现在深度学习如日中天,也取得了非常好的效果,但是MF

梅尔倒谱系数MFCC由浅入深(超详细)

MFCC梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients) 在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,简称MFCC)。根据人耳听觉机理的研究发现,人耳对不同频率的声