首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
子带专题
语音断点检测(短时改进子带谱熵)
1. 音频分析 1.输出语音的切分时间点信息,时间点用毫秒表示; 2.把语音分割成多个wav文件; 端点检测:确定句子的时间起始点和终点,忽略中间少量的非语音帧, 用于语音识别。(Speech Endpoint Detection) 熵在信息论中是反映信息度量的一个量。某随机事件的随机性越大, 即不确定性越高,则熵值也越大,所以携带的信息量亦越大。 本次作业采用 谱熵法 对语音进行端点检测。
阅读更多...