将音频分割为60s内的短文件[Cygwin; speech-vad-demo]

本文主要是介绍将音频分割为60s内的短文件[Cygwin; speech-vad-demo]，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

安装Cygwin和打开

Windows 安装 cygwin，及cygwin 中下载cmake make gcc g++等编译软件
安装后，打开cygwin软件，进入相应目录E:\Program_Files\Cygwin\home\ASUS\speech-vad-demo
其中，E:\Program_Files\Cygwin是我安装Cygwin的位置，ASUS是我主机名称，speech-vad-demo是从GitHub点这里下载的代码并解压。

具体操作：
在这里插入图片描述
桌面上有相应图标，双击打开，pwd显示当前位置，结果为：/home/ASUS，实际对应的位置是E:\Program_Files\Cygwin\home\ASUS。
将speech-vad-demo代码文件复制到ASUS目录下。通过cd speech-vad-demo命令进入即可。

修改代码

1，复制待切分音频到./speech-vad-demo/pcm文件夹中，如result.wav。
2，打开./speech-vad-demo/src/main.c文件，修改第16行为：

const char filename[] = "pcm/result.wav"; // 读取的文件

保存。
3，在cygwin命令行窗口输入sh build_and_run.sh

效果

在这里插入图片描述

切分完成，可以看到。
音频文件通过 HMM（高斯混合模型）切分为一些小于60s的片段，而且分割点都是说话人停顿的地方。

（一切似乎进展的很顺利，然而。。）
后续并不顺利，百度ai语音识别转换时报错了

资料

集成Webrtc的VAD，用于切分音频文件 https://github.com/Baidu-AIP/speech-vad-demo

Windows 安装 cygwin，及cygwin 中下载cmake make gcc g++等编译软件
然后，sh build_and_run.sh

windows 安装cygwin教程 https://blog.csdn.net/chunleixiahe/article/details/55666792
Windows：安装cygwin教程 https://blog.csdn.net/lvsehaiyang1993/article/details/81027399

百度AI平台：http://ai.baidu.com/ai-doc

这篇关于将音频分割为60s内的短文件[Cygwin; speech-vad-demo]的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！