首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
fbank专题
Fbank及MFCC学习
Fbank:FilterBank:人耳对声音频谱的响应是非线性的,Fbank就是一种前端处理算法,以类似于人耳的方式对音频进行处理,可以提高语音识别的性能。获得语音信号的fbank特征的一般步骤是:预加重、分帧、加窗、短时傅里叶变换(STFT)、mel滤波、去均值等。对fbank做离散余弦变换(DCT)即可获得mfcc特征。 MFCC(Mel-frequency cepstral coeffic
阅读更多...