本文主要是介绍RNNOISE 16K音频训练方式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
鉴于很多同学都在问RNNoise如何把48k的原始代码改成能训练16k音频的,
我就把我做的rnnoise 16k的一些小改动开源出来, 一起探讨研究。
先mark, 后面详细来介绍如何改,代码已经放上了github
RNNoise_16k 训练代码
https://github.com/YongyuG/rnnoise_16k
有问题请提出来,1年多前的东西,很多代码都没整理
这个东西大家还可以试试的几个地方:
1. 多卡训练
2. FFT训练,可以尝试舍弃pitch filter以及滤波了
3.网络结构的实验
4.vad的方法,我好像开源出来了,如果没有的话可以尝试把里面vad替换一下webrtc的vad
相信各位聪明的同学已经知道如何修改了!!!!
记得给github项目点赞哦如果有用的话!!
这篇关于RNNOISE 16K音频训练方式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!