本文主要是介绍将音频分割为60s内的短文件[Cygwin; speech-vad-demo],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
安装Cygwin和打开
Windows 安装 cygwin,及cygwin 中 下载cmake make gcc g++等编译软件
安装后,打开cygwin软件,进入相应目录E:\Program_Files\Cygwin\home\ASUS\speech-vad-demo
其中,E:\Program_Files\Cygwin
是我安装Cygwin的位置,ASUS
是我主机名称,speech-vad-demo
是从GitHub点这里下载的代码并解压。
具体操作:
桌面上有相应图标,双击打开,pwd
显示当前位置,结果为:/home/ASUS
,实际对应的位置是E:\Program_Files\Cygwin\home\ASUS
。
将speech-vad-demo
代码文件复制到ASUS目录下。通过cd speech-vad-demo
命令进入即可。
修改代码
1,复制待切分音频到./speech-vad-demo/pcm
文件夹中,如result.wav。
2,打开./speech-vad-demo/src/main.c
文件,修改第16行为:
const char filename[] = "pcm/result.wav"; // 读取的文件
保存。
3,在cygwin命令行窗口输入sh build_and_run.sh
效果
切分完成,可以看到。
音频文件通过 HMM(高斯混合模型) 切分为一些小于60s的片段,而且分割点都是说话人停顿的地方。
(一切似乎进展的很顺利,然而。。)
后续并不顺利,百度ai语音识别转换时报错了
资料
集成Webrtc的VAD,用于切分音频文件 https://github.com/Baidu-AIP/speech-vad-demo
Windows 安装 cygwin,及cygwin 中 下载cmake make gcc g++等编译软件
然后,sh build_and_run.sh
windows 安装cygwin教程 https://blog.csdn.net/chunleixiahe/article/details/55666792
Windows:安装cygwin教程 https://blog.csdn.net/lvsehaiyang1993/article/details/81027399
百度AI平台:http://ai.baidu.com/ai-doc
这篇关于将音频分割为60s内的短文件[Cygwin; speech-vad-demo]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!