VQE音频处理流程

2024-01-15 01:12

文章标签 音频流程处理 vqe

本文主要是介绍VQE音频处理流程，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

VQE

上行VQE，主要针对MIC采集部分的音频增强

在这里插入图片描述

下行VQE，主要针对SPK播放部分的音频增强

在这里插入图片描述

附关键词解释

RES
RES 模块为重采样（Resampler）模块。当AI上行或AO下行通路中开启VQE 各功能
模块时，在处理前后各存在一次重采样，第一次的作用是将输入采样率下的音频数据转换成功能模块所支持的工作采样率（8kHz/16kHz/48kHz），第二次则将工作采样率下的数据转换成输出采样率。
HPF
HPF为高通滤波（high-pass filte）模块，主要负责去除低频噪声。
低频噪声来源经常为硬件噪声或工频噪声，表现为轰轰轰类不舒适的声音。我们可以
通过使用频谱分析单板在安静环境下录制的码流，来确定是否需要加入该模块。如果
低频噪声不是非常明显，并且客户需要保留低频部分的音源，则不建议加入该模块。
HDR
HDR为高动态范围（High Dynamic Range）模块，主要用于Codec输入音量控制，通
过动态调节Codec增益控制Codec音量在合理范围内，保证声音不至于过大或过小。
EQ
EQ模块为均衡处理器（Equalizer）模块，主要对音频数据进行均衡处理，以调节音频
数据中各频段声音的增益。
DRC
DRC为动态压缩控制（Dynamic Range Control）模块，负责控制输出电平，将输出增
益控制在一个范围，主要工作在需要保证声音不至于过大或过小的场景下。
DRC与AGC作用相似，但算法实现及调节力度不同。其配合RNR 使用在运动DV场
景，与AEC/ANR 互斥。
RNR
RNR为录音噪声消除（Record Noise Reduction）模块，主要工作在需要去除环境噪
声，但保留小信号输入的场景下。
与 ANR 算法比起来，RNR 更讲究细节输入（小信号）的保留度，RNR 会在降噪的同
时保留小信号的输入，所以降噪力度会低一点，但能更多的保留现场声音，真实还原
场景，适用于运动DV 场景。
AGC
AGC为自动增益控制（Auto Gain Control）模块，主要负责增益控制输出电平，在声
音输入音量有大小变化时，能将输出音量控制在比较一致的范围内，主要工作在需要
保证声音不至于过大或过小的场景下。
AGC更多起到的作用是放大输入源的声音，以保证音源过小时，经过算法处理后的声
音依然很大。AI通路如果使能了AGC 功能，那么将不再能够通过调节AI增益来控制
输出声音大小，需要通过接口来控制声音输出大小。
PEQ
PEQ 为参量均衡器（Parameter Equalizer）模块，主要对音频数据进行均衡处理，以调
节音频数据中各频段声音的增益。
PEQ 与EQ 均为均衡处理器，但是PEQ 调节方式更灵活，适用于运动DV 场景。
AEC
回声抵消（Acoustic Echo Cancellation）模块，主要工作在需要进行去除回声的
场景下：如IPC 对讲，远端语音数据在AO 设备上播放，此时在本地通过MIC 采集语
音数据，它支持消除录制的语音数据中的AO设备播放的声音（回声）。
ANR
ANR为语音降噪（Audio Noise Reduction）模块，主要工作在需要去除外界噪声，保
留语音输入的场景下。
与 RNR 算法比起来，ANR 更讲究噪声处理的干净程度。ANR 会滤除一些环境声音，
主要保留语音数据，并会带来一定的细节丢失。所以ANR 算法更适用于NVR 和IPC
场景。在这两个场景下，我们更希望能够着重保留人声，滤除其他噪声。
GAIN
GAIN 模块是音量调节模块，主要用于调节AGC开启后的音量大小。
AGC负责对语音的音量进行动态增益控制，算法能够处理的Sin语音电平范围为0dB
至-40dB，处理完毕后的语音电平最大值为-2dB，并且在语音最大增益方面做到了
30dB的增益，这使得sout的语音电平能够做到-2dB至-10dB，同时也使得通过调整AI
增益来调整sout的音量成了一个很困难的事情，因此GAIN模块在VQE 处理流程中位
于AGC 模块后端，以实现AI上行通路的音量调节。