本文主要是介绍浅析TF-GSC,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
原文转载于:http://blog.csdn.net/bellshape/article/details/65447099,非常感谢。
1.概述
GSC(Generalized Sidelobe Canceller,广义旁瓣相消器)是麦克风阵列处理中实现语音增强的一种方法。本文主要关注arbitrary(任意的) ATF(Acoustical Transfer Function,声学传递函数)模型下基于频域的TF-GSC(Transfer Function Generalized Sidelobe Canceller,传递函数广义旁瓣相消器)的原理。
符号表示:对语音信号做短时傅里叶变换,用 k 表示各频点, l 表示帧编号, S(k,l) 表示desired signal(期望信号), Z(k,l)=(Z1(k,l),...,ZM(k,l))T 表示M个麦克风的观测信号, A(k)=(A1(k),...,AM(k))T 表示声源到各麦克风的ATF。 W(k,l)=(W1(k,l),...,WM(k,l))T 表示滤波器的系数。 Y(k,l) 表示TF-GSC的输出。
2.原理
1)优化问题
TF-GSC的目标是求解如下优化问题:
s.t.WH(k,l)A(k)=1.
其中 ϕZZ 是 Z(k,l) 的PSD matrix(功率谱矩阵)。由于 Y(k,l)=WH(k,l)Z(k,l) ,因此minimize(最下化)的对象是 E{Y(k,l)Y∗(k,l)} ,而约束条件则保证了输出等于 S(k,l) ,因此TF-GSC的目标是求得 W使得保证完美dereverberation(去混响)的同时实现最大程度的noise reduction(降低噪声)。
2)TF-GSC结构
图1
如图1所示,TF-GSC由三部分组成:fixed beamformer(固定波束形成器)( W0 )、blocking matrix(矩塞矩阵)( H )、multichannel ANC(多通道自适应相消器)( G )。其中 W0(k,l)=A(k)/||A(k)||2 是上述约束等式的最小范数解,而BM的列张成 A(k) 的零空间,因此总滤波器系数 W(k,l)=W0(k,l)−H(k,l)G(k,l) 总能满足上述约束条件。因此constrained(约束)最小化问题可以转化为如下unconstrained(不受约束)最小化问题:
minG{[W0(k,l)−H(k,l)G(k,l)]HϕNSNS(k,l)[W0(k,l)−H(k,l)G(k,l)]}
这个unconstrained最优化问题可以用LMS(least mean square,最下均差)求解。可以看出,fixed beamformer主要实现dereverberation,blocking matrix输出纯噪声,用于产生noise reference signals(噪声参考信号),multichannel ANC实现自适应降噪。
3)ATF估计
求解fixed beamformer和blocking matrix需要已知ATF。在实际室内环境下,RIR(Room Impulse Response,房间冲激响应)非常长,难以估计。RTF(Relative Transfer Function,相关传递函数) A~(k)=A(k)/A1(k) 表示麦克风之间的传递函数,其对应的impulse response能量衰减比ATF快得多,更容易准确估计。[1]介绍了两种估计RTF的方法,思想是求某个等式的least square解,具体方法不再赘述。
需要注意的是fixed beamformer变为: W0(k,l)=A~(k)/||A~(k)||2 。这种情况下算法无法实现dereverberation,因为约束条件只能保证恢复 A1(k)S(k,l) 。
以下为TF-GSC算法的简要概括:
3.MATLAB验证
仿真环境:室内环境(RIR由Image method产生)、一位说话人,一个point source noise(点源噪声)。6个均匀排布的线阵麦克风,间距为6cm。对比某个麦克风的observed signal(观测信号)与TF-GSC的输出如图2所示。
- 为什么TF-GSC之后通常要加postfiltering(后置滤波)进一步降噪?
5.参考文献
[1]: Gannot S, Cohen I. AdaptiveBeamforming and Postfiltering[M]. Springer Berlin Heidelberg, 2008.
[2]: Benesty J, Chen J, Huang Y.Microphone Array Signal Processing[M]. Springer Berlin Heidelberg, 2008.
[3]: Gannot S, Cohen I. Speech Enhancement Based on the GeneralTransfer Function GSC and Postfiltering[J].2004.
[4]:bellshape.http://blog.csdn.net/bellshape/article/details/65447099.
这篇关于浅析TF-GSC的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!