首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
rnnoise专题
关于RNNoise、webrtc_ns、三角带通滤波器、对数能量
语音特征参数MFCC提取过程详解 其中讲解了:三角带通滤波器 、计算每个滤波器组输出的对数能量、对数能量、经离散余弦变换(DCT)得到MFCC系数 推荐阅读某乎这位大佬的全部文章: 下面是几篇出自这位大佬的很好的文章: RNNoise超详细解读 webrtc_ns总结笔记 基音计算/音高追踪/pitch tracking笔记
阅读更多...
关于RNNoise、webrtc_ns、三角带通滤波器、对数能量
语音特征参数MFCC提取过程详解 其中讲解了:三角带通滤波器 、计算每个滤波器组输出的对数能量、对数能量、经离散余弦变换(DCT)得到MFCC系数 推荐阅读某乎这位大佬的全部文章: 下面是几篇出自这位大佬的很好的文章: RNNoise超详细解读 webrtc_ns总结笔记 基音计算/音高追踪/pitch tracking笔记
阅读更多...
RNNOISE 16K音频训练方式
鉴于很多同学都在问RNNoise如何把48k的原始代码改成能训练16k音频的, 我就把我做的rnnoise 16k的一些小改动开源出来, 一起探讨研究。 先mark, 后面详细来介绍如何改,代码已经放上了github RNNoise_16k 训练代码 https://github.com/YongyuG/rnnoise_16k 有问题请提出来,1年多前的东西,很多代码都没整理 这
阅读更多...
RNNoise要注意的部分(草稿记录)
rnnoise会有一个pitch_filter 这是由于因为它们在生成特征时不是用频域上所有频点,而是采取bark's scale的切分频段来对不同频率的频段进行特征处理 这样的话频域上的分辨率会降低,然后导致最后在进行降噪后生成的语音会有一个现象就是oversmoothing,即你会辨别不清共振峰. 尽管bark's scale 在低频部分的频段分得很细,但是他把好几个频率都归为一个频带,
阅读更多...