麦克风波束成形的基本原理

2024-02-16 08:48

本文主要是介绍麦克风波束成形的基本原理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

麦克风波束成形的基本原理

2012年04月05日 10:04     eechina
关键词:  波束 ,  麦克风
作者:ADI公司Jerad Lewis

简介


所有MEMS麦克风都具有全向拾音响应,也就是能够均等地响应来自四面八方的声音。多个麦克风可以配置成阵列,形成定向响应或波束场型。经过设计,波束成形麦克风阵列可以对来自一个或多个特定方向的声音更敏感。

麦克风波束成形是一个丰富而复杂的课题。本应用笔记仅讨论基本概念和阵列配置,包括宽边求和阵列和差分端射阵列,内容涵盖设计考虑、空间和频率响应以及差分阵列配置的优缺点。

1.jpg 
图1:空气中声波的频率与波长的关系

方向性和极坐标图

方向性描述麦克风或阵列的输出电平随消声空间中声源位置的改变而变化的模式。ADI公司的所有MEMS麦克风都是全向麦克风,即它们对来自所有方向的声音都同样敏感,与麦克风所处的方位无关。图2所示为全向麦克风响应的2轴极坐标图。无论麦克风的收音孔位于x-y平面、x-z平面还是y-z平面,此图看起来都相同。

2.jpg 
图2:全向麦克风响应图

本应用笔记中,阵列的“前方”称为轴上方向,指拾取目标音频的方向,在极坐标图上标为0°;“后方”为180°方向;“侧边”指前后方之间的空间,中心方向分别位于90°和270°。本应用笔记中的所有极坐标图均归一化到0°响应水平。

涉及声音频率和波长的所有公式都使用以下关系式:c = f × λ,其中c为343 m/s,即声音在20℃的空气中的传播速度。图1显示了这些条件下声波的频率与波长的关系。本应用笔记末尾的“设计参数计算公式”列出了本文所用阵列设计参数的计算公式。

宽边阵列

宽边麦克风阵列是指一系列麦克风的排列方向与要拾取的声波方向垂直(见图3)。图中,d是阵列中两个麦克风元件的间距。来自阵列宽边的声音通常就是要拾取的声音。

3.jpg 
图3:双麦克风宽边阵列

宽边阵列可以通过基本处理实现,阵列中的麦克风简单地相加。此类阵列的缺点是它只能衰减来自阵列侧边的声音。后方响应始终与前方响应一致,因为阵列具有轴对称性,无法区分从前方与从后方到达麦克风的声压波。宽边阵列适用于阵列背面或上下方没有很多声音的应用,例如壁挂式电视。

在双麦克风宽边阵列中,响应的最小值出现在90°和270°。这些点的信号衰减在很大程度上取决于频率。当入射频率的半波长接近麦克风的间距时,响应接近完全抵消。对于两个间距75 mm的麦克风组成的阵列,理论上,当频率约为2.3 kHz (343 m/s ÷ (0.075 m × 2)≈2.3 kHz)时,响应完全抵消。

高于理想衰减的频率时,频率将混叠,极坐标响应开始在其它角度显示零点。此时,侧边衰减再次开始降低。例如,图4中的3 kHz信号(淡蓝色线)发生混叠。

4.jpg 
图4:间距75 mm的双麦克风宽边阵列的响应

频率响应

宽边波束成形器具有平坦的轴上频率响应,因为它只是将接收同一信号的两个麦克风的信号相加。图5显示了间距75 mm的双麦克风宽边波束成形器的归一化响应。在轴外,该图清楚地显示了响应的零点。

5.jpg 
图5:不同入射角时宽边波束成形器的归一化频率响应

具有更多元件的宽边阵列

也可以构建具有两个以上元件的宽边阵列,只需将额外的麦克风与原来的两个麦克风对齐,如图6所示。宽边阵列中的麦克风数量越多,对来自阵列侧边的声音的衰减就越强。图7显示了间距75 mm的三麦克风宽边阵列的响应。该阵列中,来自侧边的声音衰减6 dB,而在双麦克风宽边阵列中,声音只衰减3 dB。然而,发生混叠(立体交叉型)的频率现在更低,因为所有麦克风之间的总距离已从75 mm增加到150 mm。

6.jpg 
图6:三麦克风宽边阵列

7.jpg 
图7:间距75 mm的三麦克风宽边阵列的响应

缩小宽边阵列中的麦克风间距可以提高混叠频率,但会降低低频时的衰减。设计宽边阵列时,必须权衡考虑这两个因素。对多麦克风宽边阵列中的各麦克风应用不同的加权系数,可以进一步减少混叠。此外,通过延迟各麦克风的输出,可以将宽边阵列的主响应角调整到前方以外的角度。系数和延迟的计算以及相应的极坐标图形超出了本应用笔记的范围。

端射阵列

在端射阵列中,多个麦克风的排列方向与声音传播的目标方向一致。如果阵列中前方麦克风(声音在轴上传播最先达到的麦克风)的信号与后方麦克风的反转延迟信号相加,则这种配置称为“差分阵列”。图8显示了一个双麦克风端射差分阵列,麦克风间距为d,后方麦克风的信号在到达减法(或反转求和)模块之前延迟n个采样周期。这可以用来创建心型、高心型或超心型拾音模式,其中来自阵列后方的声音被大大衰减。

8.jpg 
图8:双麦克风端射阵列

当麦克风间距和时间延迟均选择得当时,针对混叠频率以下的频率,延迟求和波束成形器的响应是心型图案(见图9)。心型图案不会衰减阵列前方的信号;理论上,它会完全消除以180°入射到阵列的声音。一阶(双麦克风)延迟求和波束成形器的侧边信号衰减6 dB。

9.jpg 
图9:双麦克风端射心型波束成形器的响应

假设声音是可近似为平面波的远场传播,那么在端射阵列中,不同麦克风拾取的声音仅有到达时间上的差别。为了创建心型拾取模式,应当延迟来自后方麦克风的信号,延迟时间等于声波在两个麦克风元件之间传输所需的时间。这为设计端射波束成形器的系统设计工程师提供了两个自由度:麦克风的间距和应用于处理器的延迟时间。在许多音频应用中,延迟时间的选择取决于采样速率(fS)。如果DSP的延迟时间由单一样本的周期决定,则当fS= 48 kHz时,最短延迟为21μs。20°C时,声音在空气中的传播速度为343 m/s;因此声波在21μs内大约行进7 mm。利用不同滤波器,如延迟同步滤波器、全通滤波器和FFT滤波器组等,可以实现小数采样延迟,但此类处理超出了本文的范围。

与宽边阵列一样,麦克风的间距决定目标方向响应的第一个零点。麦克风之间距离越近,零点频率越高(因而带宽更宽)。距离越远,则阵列的物理长度越长,可能会与工业设计限制相抵触。再次假设fS= 48 kHz,取3样本延迟时间,则声音时间延迟约为63μs。这是声音行进约21 mm所需的时间,该距离即为实现心型图案所需的麦克风元件间距。8.2 kHz声波的半波长为21 mm,因此这就是零点频率。图10显示了图9所示相同端射配置的响应,此外还显示了10kHz时的响应。除了后方的零点以外,大约±52°处还有两个零点。

10.jpg 
图10:双麦克风端射波束成形器的频率混叠

为实现良好性能的波束成形阵列,具有电气延迟的麦克风之间的距离匹配至关重要。图11显示了在保持延迟时间不变的同时改变麦克风之间物理距离的影响。本例同样使用3样本延迟时间,对应于大约21 mm的距离,以便实现心型响应图案(fS = 48 kHz)。当麦克风之间的距离小于21 mm时,后方零点并不突出,响应为准心型图案。当物理距离大于21 mm时,响应为高心型图案,两个后方零点相对于180°点等距分开。在需要抑制的不是正后方,而是稍微散开方向的应用中,这可能正合适,而且侧边抑制也强于心型响应的侧边抑制。

11.jpg 
图11:改变端射波束成形器麦克风距离的影响

频率响应

差分阵列波束成形器的频率响应不是平坦的,在零点频率范围内,它具有高通滤波器响应特征。一阶波束成形器(两个麦克风元件)的响应以6 dB/倍频程的速率随频率而提高,在混叠频率以上归于平坦。在零点频率,阵列理论上没有输出,因为延迟信号恰好与前方麦克风的信号抵消。

图12显示了不同入射角时双麦克风差分阵列波束成形器的频率幅度响应。图中,0 dB点是单个全向麦克风输出电平。该波束成形器使用21 mm间距和3样本延迟时间,因此轴上零点出现在大约8.2 kHz时。在轴上,响应以6 dB/倍频程的速率提高,直到入射信号的四分之一波长与麦克风间距相同时。过了这一点后,响应降低到零点,然后再次在3/4波长点时提高到最大值。除了阵列元件间距与入射信号半波长相同时的轴上零点以外,在半波长的各倍数处也存在零点。

12.jpg 
图12. 不同入射角时端射波束成形器的频率响应

注意,入射角为90°的信号响应比入射角为0°的信号响应低6 dB,在轴上零点频率时具有最大输出电平。

差分波束成形算法的输出通常会应用一个均衡(EQ)滤波器,以使响应平坦。

零点频率应适当选择,不应干扰目标频率,但又不能太高,以至于造成低频信号被过分衰减。在使用单样本延迟时间(fS= 48 kHz)和7 mm麦克风间距的端射差分阵列中,零点频率约为24.5 kHz。如果麦克风间距为84 mm,并且使用6样本延迟时间,则混叠频率为4.2 kHz。设计通常要求零点频率位于以上两者之间,这样既不至于太低,导致零点频

率干扰语音的带宽,又不至于太高,导致低频响应被高度衰减。基于这样要求,麦克风间距的选择一般要与两个到四个样本的延迟时间匹配。同样,以上均假设fS= 48 kHz。所有这些计算均与采样速率成线性比例关系。

高阶端射阵列

通过增加更多的麦克风并使它们与最初的两个对齐,可以构成高阶差分阵列波束成形器。这将能更好地抑制来自后方和侧边的声音,但是,构建波束成形器的物理距离当然也更长。图13显示了一个二阶(三麦克风)端射波束成形器的例子。在阵列后方的零点相同的情况下,二阶端射波束成形器可以实现12 dB的侧边衰减,如图14所示。图中,蓝色线是一阶(双麦克风)波束成形器的响应,红色线是二阶波束成形器的响应。

13.jpg 
图13:二阶差分波束成形阵列

14.jpg 
图14:一阶与二阶端射波束成形器的比较

对于更高阶端射波束成形器,可以运用同样的思路,不过阵列尺寸显然会增大。

麦克风匹配

为实现良好性能的麦克风波束成形器,阵列中不同元件的灵敏度和频率响应必须精密匹配。如果不同元件的这两个参数有差异,就无法实现阵列的期望响应,零点可能不那么突出,阵列的方向性可能不是很恰当。ADI公司MEMS麦克风的灵敏度和频率响应均精密匹配,非常适合用于波束成形阵列。

阵列处理对系统噪声的影响

对信噪比(SNR)的影响取决于阵列配置和处理,阵列拓扑结构不同,可能会导致系统SNR提高或降低。必须选择SNR规格最高的麦克风,从而使总体系统性能最高。

在轴上,宽边波束成形器的输出类似于将两个相同信号简单相加以改善SNR。在宽边求和阵列中,多个麦克风本身的噪声以指数形式相加。因此,麦克风数量每增加一倍,噪声就会提高3 dB。这种情况下,信号电平加倍,提高6 dB,而噪声则以非相干形式相加,总电平仅提高3 dB,因此SNR性能提高3 dB。在轴外,此波束成形器的信号输出不是平坦的,如图5所示。在轴外入射角,由于信号电平降低,SNR低于轴上峰值。

差分阵列对SNR的影响更复杂,在此不进行量化分析。对于波长为麦克风间距2倍的频率(在图12所示例子中,此频率约为4.1 kHz),双麦克风差分阵列波束成形器的轴上频率响应为6 dB。在此频率附近,阵列信号的输出与其噪声的差别高于各麦克风的输出与其噪声的差别,但整个频率范围内的信噪比关系更加难以计算。

多个麦克风的放置

阵列中麦克风收音端口之间的线性距离只是构建麦克风阵列时需要考虑的路径之一。虽然ADI公司的MEMS麦克风非常薄,但仍有一定的高度,进行阵列设计时应当予以考虑。ADI公司MEMS麦克风薄膜上的声学中心位于收音端口以上0.57 mm。除了麦克风所在PCB的厚度以外,选择麦克风间距时还应考虑此距离。如果所有麦克风都以同样的方式安装(同一PCB、相同收音端口长度),那么这不是一个问题。

高级波束成形

本应用笔记仅仅讨论了麦克风波束成形的基本原理,并未详细介绍这一处理领域。采用不同数量麦克风和不同配置的阵列显然是可行的,其信号处理算法的复杂度可能远远超过本文所述的简单算法。更高级的算法可以用于语音跟踪和波束导引,甚至只需少量麦克风。

本文所述的阵列均为线性分布,但在更高级的高阶波束成形器中,各对麦克风之间的间距可以不同。这种配置会改变零点和混叠频率以及不同麦克风的信噪比,有可能使阵列的噪声更低,可用频率响应更宽。

附:宽边与端射波束成形器的优缺点
15.jpg 

这篇关于麦克风波束成形的基本原理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/714063

相关文章

无线领夹麦克风什么牌子好用?揭秘领夹麦克风哪个牌子音质好!

随着短视频行业的星期,围绕着直播和视频拍摄的电子数码类产品也迎来了热销不减的高增长,其中除了数码相机外,最为重要的麦克风也得到了日益增长的高需求,尤其是无线领夹麦克风,近几年可谓是异常火爆。别看小小的一对无线麦克风,它对于视频拍摄的音质起到了极为关键的作用。 不过目前市面上的麦克风品牌种类多到让人眼花缭乱,盲目挑选的话容易踩雷,那么无线领夹麦克风什么牌子好用?今天就给大家推荐几款音质好的

防盗链的基本原理与实现

我的实现防盗链的做法,也是参考该位前辈的文章。基本原理就是就是一句话:通过判断request请求头的refer是否来源于本站。(当然请求头是来自于客户端的,是可伪造的,暂不在本文讨论范围内)。首先我们去了解下什么是HTTP Referer。简言之,HTTP Referer是header的一部分,当浏览器向web服务器发送请求的时候,一般会带上Referer,告诉服务器我是从哪个页面链接过来的,服务

【CSS in Depth 2 精译_023】第四章概述 + 4.1 Flexbox 布局的基本原理

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第一章 层叠、优先级与继承(已完结) 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结 第二章 相对单位(已完结) 2.1 相对单位的威力2.2 em 与 rem2.3 告别像素思维2.4 视口的相对单位2.5 无单位的数值与行高2.6 自定义属性2.7 本章小结 第三章 文档流与盒模型(已

AI学习指南深度学习篇-带动量的随机梯度下降法的基本原理

AI学习指南深度学习篇——带动量的随机梯度下降法的基本原理 引言 在深度学习中,优化算法被广泛应用于训练神经网络模型。随机梯度下降法(SGD)是最常用的优化算法之一,但单独使用SGD在收敛速度和稳定性方面存在一些问题。为了应对这些挑战,动量法应运而生。本文将详细介绍动量法的原理,包括动量的概念、指数加权移动平均、参数更新等内容,最后通过实际示例展示动量如何帮助SGD在参数更新过程中平稳地前进。

Zookeeper基本原理

1.什么是Zookeeper?         Zookeeper是一个开源的分布式协调服务器框架,由Apache软件基金会开发,专为分布式系统设计。它主要用于在分布式环境中管理和协调多个节点之间的配置信息、状态数据和元数据。         Zookeeper采用了观察者模式的设计理念,其核心职责是存储和管理集群中共享的数据,并为各个节点提供一致的数据视图。在Zookeeper中,客户端(如

Filter基本原理和使用

https://www.cnblogs.com/xdp-gacl/p/3948353.html 一、Filter简介   Filter也称之为过滤器,它是Servlet技术中最激动人心的技术,WEB开发人员通过Filter技术,对web服务器管理的所有web资源:例如Jsp, Servlet, 静态图片文件或静态 html 文件等进行拦截,从而实现一些特殊的功能。例如实现URL级别的权限访问控

麦克风MIC 工作原理以及灵敏度调整

https://blog.csdn.net/Charles0512/article/details/50472467?locationNum=6&fps=1 1、先看MIC电路连接 这是个差分输入的例子,MICP2和MICN2是一对差分信号,经过C156的滤波,输入到MIC两端 MIC两引脚分别是到地和供电,上图的R177参数就关系到MIC输入的灵敏度 2、电阻R177影响灵敏度分析 M

golang学习笔记02——gin框架及基本原理

目录 1.前言2.必要的知识3.路由注册流程3.1 核心数据结构3.2 执行流程3.3 创建并初始化gin.Engine3.4 注册middleware3.5 注册路由及处理函数(1)拼接完整的路径参数(2)组合处理函数链(3)注册完成路径及处理函数链到路由树 3.6 服务端口监听 4. 请求处理5. 请求绑定和响应渲染5.1. 请求绑定5.2 响应渲染 结束语 1.前言 g

DDS基本原理--FPGA学习笔记

DDS信号发生器原理: `timescale 1ns / 1ps//// Company: // Engineer: // // Create Date: 2024/09/04 15:20:30// Design Name: hilary// Module Name: DDS_Module//module DDS_Module(Clk,Reset_n,Fword,

小琳Python课堂:Python高并发实现的基本原理(高阶版)

大家好,这里是小琳Python课堂! 今天,我们将从高阶视角深入探讨Python高并发实现的基本原理,特别是线程安全性、线程同步和原子性这三个核心概念。这些概念对于构建复杂、高效的多线程应用程序至关重要。 线程安全性 首先,让我们深入理解线程安全性。线程安全性涉及到在多线程环境中对共享资源的正确访问。在Python中,由于全局解释器锁(GIL)的存在,真正的并行执行需要通过多进程实现。然而,即