浅析TF-GSC

2024-02-18 02:10
文章标签 tf 浅析 gsc

本文主要是介绍浅析TF-GSC,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文转载于http://blog.csdn.net/bellshape/article/details/65447099,非常感谢。

1.概述

  GSC(Generalized Sidelobe Canceller,广义旁瓣相消器)是麦克风阵列处理中实现语音增强的一种方法。本文主要关注arbitrary(任意的) ATF(Acoustical Transfer Function,声学传递函数)模型下基于频域的TF-GSC(Transfer Function Generalized Sidelobe Canceller,传递函数广义旁瓣相消器)的原理。 
  符号表示:对语音信号做短时傅里叶变换,用 k  表示各频点, l  表示帧编号, S(k,l) 表示desired signal(期望信号), Z(k,l)=(Z1(k,l),...,ZM(k,l))T 表示M个麦克风的观测信号, A(k)=(A1(k),...,AM(k))T 表示声源到各麦克风的ATF。 W(k,l)=(W1(k,l),...,WM(k,l))T 表示滤波器的系数。 Y(k,l) 表示TF-GSC的输出。

2.原理

1)优化问题

  TF-GSC的目标是求解如下优化问题: 

minW{WH(k,l)ϕZZW(k,l)}  
s.t.WH(k,l)A(k)=1.  

      其中 ϕZZ Z(k,l) 的PSD matrix(功率谱矩阵)。由于 Y(k,l)=WH(k,l)Z(k,l) ,因此minimize(最下化)的对象是 E{Y(k,l)Y(k,l)} ,而约束条件则保证了输出等于 S(k,l) ,因此TF-GSC的目标是求得 W使得保证完美dereverberation(去混响)的同时实现最大程度的noise reduction(降低噪声)。

2)TF-GSC结构


picture 
图1 

  如图1所示,TF-GSC由三部分组成:fixed beamformer(固定波束形成器)( W0 )、blocking matrix(矩塞矩阵)( H )、multichannel ANC(多通道自适应相消器)( G )。其中 W0(k,l)=A(k)/||A(k)||2 是上述约束等式的最小范数解,而BM的列张成 A(k) 的零空间,因此总滤波器系数 W(k,l)=W0(k,l)H(k,l)G(k,l) 总能满足上述约束条件。因此constrained(约束)最小化问题可以转化为如下unconstrained(不受约束)最小化问题: 

minG{[W0(k,l)H(k,l)G(k,l)]HϕNSNS(k,l)[W0(k,l)H(k,l)G(k,l)]}  

这个unconstrained最优化问题可以用LMS(least mean square,最下均差)求解。可以看出,fixed beamformer主要实现dereverberation,blocking matrix输出纯噪声,用于产生noise reference signals(噪声参考信号),multichannel ANC实现自适应降噪。

3)ATF估计

  求解fixed beamformer和blocking matrix需要已知ATF。在实际室内环境下,RIR(Room Impulse Response,房间冲激响应)非常长,难以估计。RTF(Relative Transfer Function,相关传递函数) A~(k)=A(k)/A1(k) 表示麦克风之间的传递函数,其对应的impulse response能量衰减比ATF快得多,更容易准确估计。[1]介绍了两种估计RTF的方法,思想是求某个等式的least square解,具体方法不再赘述。 
  需要注意的是fixed beamformer变为: W0(k,l)=A~(k)/||A~(k)||2 。这种情况下算法
无法实现dereverberation,因为约束条件只能保证恢复 A1(k)S(k,l)

以下为TF-GSC算法的简要概括:


3.MATLAB验证

  仿真环境:室内环境(RIR由Image method产生)、一位说话人,一个point source noise(点源噪声)。6个均匀排布的线阵麦克风,间距为6cm。对比某个麦克风的observed signal(观测信号)与TF-GSC的输出如图2所示。 


picture 
图2 

4.Q&A

  1. 为什么TF-GSC之后通常要加postfiltering(后置滤波)进一步降噪? 
      TF-GSC只能消除coherent noise(相干性噪声)(ANC的局限),实际noise field包括coherent noise、diffused noise(扩散噪声)、incoherent noise以及nonstationary noise。TF-GSC的ANC部分只能消除coherent noise和diffused noise的低频部分,在其他情况下,TF-GSC的ANC部分没起作用,降噪主要靠fixed beamformer,性能十分有限。加入postfiltering可以提高其他情况下的降噪性能。


5.参考文献

[1]: Gannot S, Cohen I. AdaptiveBeamforming and Postfiltering[M]. Springer Berlin Heidelberg, 2008.

[2]: Benesty J, Chen J, Huang Y.Microphone Array Signal Processing[M]. Springer Berlin Heidelberg, 2008.

[3]: Gannot S, Cohen I. Speech Enhancement Based on the GeneralTransfer Function GSC and Postfiltering[J].2004.

[4]:bellshape.http://blog.csdn.net/bellshape/article/details/65447099.

 





这篇关于浅析TF-GSC的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/719721

相关文章

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

(入门篇)JavaScript 网页设计案例浅析-简单的交互式图片轮播

网页设计已经成为了每个前端开发者的必备技能,而 JavaScript 作为前端三大基础之一,更是为网页赋予了互动性和动态效果。本篇文章将通过一个简单的 JavaScript 案例,带你了解网页设计中的一些常见技巧和技术原理。今天就说一说一个常见的图片轮播效果。相信大家在各类电商网站、个人博客或者展示页面中,都看到过这种轮播图。它的核心功能是展示多张图片,并且用户可以通过点击按钮,左右切换图片。

风暴项目个性化推荐系统浅析

风暴项目的主要任务是搭建自媒体平台,作为主开发人员的我希望把工作重心放在个性化推荐系统上。 目前风暴项目的个性化推荐是基于用户行为信息记录实现的,也就是说对于每条资讯,数据库中有字段标明其类型。建立一张用户浏览表,对用户的浏览行为进行记录,从中可以获取当前用户对哪类资讯感兴趣。 若用户第一次登陆,则按默认规则选取热点资讯做推荐,及所有资讯按浏览量降序排序,取前4个。另外,我考虑到后期可能有商业

中国书法——孙溟㠭浅析碑帖《越州石氏帖》

孙溟㠭浅析碑帖《越州石氏帖》 《越州石氏帖》  是一部汇集多本摹刻的帖,南宋时期的会稽石邦哲(字熙明)把家藏的一些法书碑帖集中一起摹刻成的,宋理宗时临安书商陈思《宝刻丛编》有记載这部帖的目录。现在还存有宋代时拓的残缺本,大多是相传的晋朝唐朝的小楷,后人多有临摹学习,并以此版本重新摹刻。 (图片来源于网络) 图文/氿波整理

浅析网页不安装插件播放RTSP/FLV视频的方法

早期很多摄像头视频流使用的是RTSP、RTMP协议,播放这类协议的视频通常是在网页上安装插件。但现在越来越多的用户,对于网页安装插件比较反感,且随着移动设备的普及,用户更多的希望使用手机、平板等移动设备,直接可以查看这些协议的视频。那是否有什么方案可以直接网页打开RTSP、RTMP协议的视频,直接观看不用安装插件呢?而且对于摄像头的数据,尽可能低延迟的获取实时画面。  其实很多摄像头厂家也注意到

浅析c/c++中 struct的区别

(1)C的struct与C++的class的区别。 (2)C++中的struct和class的区别。 在第一种情况下,struct与class有着非常明显的区别。C是一种过程化的语言,struct只是作为一种复杂数据类型定义,struct中只能定义成员变量,不能定义成员函数(在纯粹的C语言中,struct不能定义成员函数,只能定义变量)。例如下面的C代码片断: 复制代码代码如下:

【深度学习 走进tensorflow2.0】TensorFlow 2.0 常用模块tf.config

无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。人工智能教程 本篇文章将会教大家如何 合理分配显卡资源,设置显存使用策略。主要使用tf.config模块进行设置。下面我们一起了解下具体用法和例子。 一、指定当前程序使用的 GPU 例如,在一台具有 4 块 GPU 和一个 C

Flink Exactly-Once 投递实现浅析

本文作者:Paul Lin 文章来源:https://www.whitewood.me 随着近来越来越多的业务迁移到 Flink 上,对 Flink 作业的准确性要求也随之进一步提高,其中最为关键的是如何在不同业务场景下保证 exactly-once 的投递语义。虽然不少实时系统(e.g. 实时计算/消息队列)都宣称支持 exactly-once,exactly-once 投递似乎是一个已被解

烟道灰酸洗废水稀有金属铼回收工艺浅析

铼是一种重要的稀有金属,因其独特的物理和化学性质,在航空航天、电子工业、石油化工等领域有着广泛的应用。由于铼的稀有性和重要性,从烟道灰中回收铼的技术和方法成为了研究的热点。以下是几种主要的烟道灰回收铼技术: ●    化学溶解法:通过选择合适的化学溶剂,如硝酸、硫酸等强酸,以及过氧化氢等氧化剂,将含铼废弃物中的铼溶解出来。 ●    溶剂萃取法:利用有机溶剂从含铼废水中萃取铼,通过选择合适的萃取剂

2024年高教社杯数学建模国赛赛题浅析——助攻快速选题

一图流——一张图读懂国赛 总体概述: A题偏几何与运动学模型,适合有几何与物理背景的队伍,数据处理复杂性中等。 B题侧重统计和优化,适合有运筹学和经济学背景的队伍,数据处理较为直接但涉及多步骤的决策优化。 C题属于优化类问题,涉及复杂的多变量优化与不确定性分析,数据处理难度大。 D题涉及概率和优化,特别是几何概率模型的推导,理论难度较高。 E题数据量较大,重点在于大规模交通数据的分