历史上的今天
返回首页

历史上的今天

今天是:2024年09月09日(星期一)

正在发生

2021年09月09日 | 超高信噪对于MEMS麦克风的重要性

2021-09-09 来源:eefocus

自动语音识别系统的普及和视频内容共享信息和经验的使用正在急剧增加。用于捕捉声音的麦克风的性能和质量必须高,以确保良好的用户体验。关键因素包括噪声、畸变、频率响应和元件匹配。

 

在之前的文章中,已经简单说明了,麦克风性能的特点通常是自噪声和动态范围。动态范围的上限由声学过载点(AOP Acoustic Overload Point)定义。下限由信噪比(SNR Signal-to-noise Ratio)定义。信噪比描述了麦克风的自噪声。麦克风只能在其自噪声层以上的声压级(SPL)下接收信号。因此,高信噪比的麦克风可以在比低信噪比的麦克风更低的声压下工作。本文,则集中于信噪比(SNR)和声学过载点(AOP),并解释了在语音识别和音频/视频捕获系统中具有高麦克风性能的好处。

 

麦克风输出中的噪声可以定义为任何不是预期输入源的信号,通常被认为是输出信号中不希望出现的元素。噪声水平越高,越会降低音频信号的质量。噪声可以来自麦克风外部,也可以来自麦克风本身。人们通常听到麦克风的自噪音作为一种嘶嘶声,影响感知的声音质量。对于算法来说,噪声会恶化信号的保真度,从而降低系统性能。

 

麦克风的噪声可以用不同的方式表达:

  • 自噪声(Vrms、dBV、dBFS)是麦克风本身在不受外界声音激励时产生的rms噪声电压。

  • 信噪比(SNR (dB))描述了麦克风相对于预期输入信号的自噪声。信噪比的测量通常使用一个标准的声学输入信号来表示想要的声音,一个94 dBSPL (1 Pa)正弦波。

 

等效输入噪声EIN (dBSPL)是进入麦克风的(假想的)声学噪声水平,它相当于麦克风输出时的电子噪声水平。

 

所有现实生活中的音频传感器都是非线性系统,因为它们向通过它们的信号添加内容。在失真的情况下,增加的内容位于原始信号中出现的频率的谐波。失真通常以总谐波失真THD(如果包含自噪声则为THD+N)来测量。它是当麦克风被正弦波激发时,信号谐波中的能量(通常是第二到第五次谐波)与基频中的能量之比。测试信号通常是一个1 kHz的正弦信号,处于相对较高的声压级(SPL),通常为94 dBSPL或更高。THD以百分比(%)表示。声学过载点,AOP通常定义为THD超过10%的声压级。AOP的单元是dBSPL。

 

在大多数情况下,保持传入麦克风的声音的原始形式和内容是有益和重要的。在原始信号中加入内容,比如失真,可能会让听声音的人听起来不舒服。增加的能量越多(即THD值越高),感知到的音频质量就越差。失真还可能使语音识别系统等算法产生混淆,特别是对输入信号的内容进行非常详细分析的语音识别系统,失真造成的影响会更大。

 

图1 Acoustical SNR 信噪比示意

 

音频/视频录制的目的是捕捉来自受试者的传入声音,并将其复制到麦克风系统的输出中。当录音是为人类的耳朵,它是可取的电子输出信号匹配的声音信号尽可能接近,提供一个“自然”的声音记录。麦克风及其信噪比是声捕获信号链的关键部分,影响录音质量。下表给出了一些典型的用例。

 


在自然情况下,每增加一倍距离,声压减半(降低6分贝)。捕获的声源越远,到达麦克风的声音信号就越安静。由于麦克风的自噪声实际上是恒定的,输入信号电平的降低会导致麦克风输出信号的信噪比降低。通常,弱信号必须被放大,使其达到设备信号路径的适当水平。放大信号也会放大输出信号中的噪声。放大倍数越大,噪声上升到显著降低捕获信号质量的水平的风险就越大。

 

高麦克风信噪比有助于保持本底噪声是几乎听不见的,即使信号被放大。捕获距离越长,麦克风的自噪声越小,以避免出现问题。当距离很长且声源本身很安静时,这一点尤其重要。当每增加一倍的距离,声压会衰减6分贝时,使用高信噪比6分贝的麦克风,可以使捕捉距离加倍而不会降低信号质量。

 

POLQA (Objective Listening Quality Assessment)是一种ITU-T标准模型,它使用数字语音分析来客观地确定录制语音信号的质量和可理解性。高信噪比的麦克风在POLQA测试中表现明显更好,并具有更好的语音清晰度。当用高信噪比麦克风记录信号时,同一水平的信号更容易理解。

 

和SNR一样,AOP也是一个重要的音频/视频质量因素。失真很容易使视频记录变得无用。网上有很多在流行音乐/摇滚音乐会上拍摄的智能手机视频,由于音频失真严重,无法观看。如果预期声音(或干扰声音)的传入声压水平高或非常高,则高AOP可以改善声音质量。高AOP帮助麦克风系统处理传入声音信号中可能出现的非常高的信号峰值,即使平均声压水平不是非常高。参见下表中的一些典型用例。

 


直到几年前,消费电子设备麦克风AOP的标准水平还在110到120 dBSPL之间。在最近的过去,AOP的需求已经上升了。为了确保音质和语音识别性能满足客户的要求,设备设计者应该选择AOPs接近或高于130 dBSPL的麦克风。在较低的声压水平下,观察比为AOP指定的10%更低的THD水平更有意义。除了拥有高的AOP之外,THD保持在低水平(低于2%)也很重要,对于预期的应用程序(例如,高达120 dBSPL), THD应该达到足够高的声压级。

 

在系统中,所捕获的声音用于算法时,声音质量目标可能与信号用于人耳时不同。信号并不一定要听起来很自然,只要它是为算法优化的。不管用例是什么,保持信号不受干扰、工件、失真和噪声的影响总是很重要的。

 

自然语音识别(ASR)是将语音信号自动转录成文字的任务。转录正确率越来越接近人类水平,大约为95%。然而,到目前为止,只有在环境条件良好的实验室里才有可能达到这个水平。在现实生活环境和远距离语音识别涉及一些重要的声学挑战,如背景噪声、混响、回声消除和麦克风定位。仅仅有一个好的语音识别引擎是不够的。系统中的每个元素都应该以高标准执行,以防止出现质量瓶颈。麦克风的工作是提供语音识别系统最好的输入信号。 高输入信号质量有助于ASR系统分析传入的声音,并找到其中的特征,从而识别语音内容。关键参数包括噪声、畸变、频率响应和相位。

 

高AOP可以帮助在嘈杂环境中的语音识别系统。有时,语音信号本身并不强,同时存在其他干扰。例如,在语音控制的家庭娱乐系统和数字助理中,有靠近麦克风的扬声器,可以输出响度大的音乐或语音信息。高AOP有助于保持低失真,改善噪声和回声的消除。

 

距离语音源越远,输入到ASR算法的信号的信噪比越低。因此,当目标捕捉距离越长,麦克风信噪比越高。

 

语音识别系统的一个关键功能是能够忽略非待转录语音的声音和噪声。音频/视频捕捉和人与人之间的沟通质量也可以通过从信号中排除不需要的声音来提高。目标是增加信噪比,在这种情况下,信噪比是想要的声音(信号)与不想要的环境声音(噪音)的比率。

 

将多麦克风与算法相结合,可以实现噪声消除和方向性。定向传声器系统,如波束形成,可以集中麦克风对所需方向的灵敏度和突出所需的声源。不需要的声音也可以根据参数取消,如两个麦克风之间的水平差异。盲源分离是一种更为复杂的降噪系统。它可以消除与方向、距离和位置无关的噪声。所有这些噪声消除方法都得益于其接收信号的准确性和高质量。麦克风应具有高信噪比,低失真,平坦频响(也改善了相位响应)和低群延迟。

 

为了优化噪声消除算法的功能,系统中使用的麦克风应该具有相同的特性。麦克风与麦克风匹配的作用至关重要。麦克风之间的灵敏度、相位特性和延迟的差异越小越好。

 

从2005年到2015年,最先进的麦克风在大众市场消费电子设备的信噪比从低于60分贝提高到约65分贝。随着新的高性能语音识别系统和其他捕获用例的需求,即使65 dB也不再足够了。目前高端麦克风的信噪比接近70分贝。


高麦克风性能是实现高语音识别和音频捕获质量的关键。自动语音识别算法和相机等技术的性能正在迅速提高,设备购买者对用户体验的期望也在提高。避免麦克风成为改进瓶颈是很重要的。幸运的是,现在有高性能的麦克风。噪声性能在过去的几年中有了显著的提高。随着AOP达到130 dBSPL的标志,SNR已经超过了70 dB的水平,而质量下降的失真正在成为过去。这种水平的麦克风性能有助于充分提升设备整体表现。

推荐阅读

史海拾趣

Anaheim Automation公司的发展小趣事

2003年,AMOTECH的压敏电阻产品被产业资源部评为“世界一流产品”,这是对公司技术实力的再次肯定。同年,公司还在韩国安全商协会进行了自动报价首次公开募股,为公司的发展筹集了更多资金。随着实力的增强,AMOTECH开始将目光投向海外市场。2004年,公司在山东建立了首家海外工厂,专注于全球定位系统天线的生产,这标志着公司国际化战略的正式启动。

Electech Electronics公司的发展小趣事

随着科技的不断发展,Electech Electronics意识到仅仅依赖电子元器件的代理和销售已经无法满足市场的需求。于是,公司开始投入研发,专注于电子产品的设计和制造。经过数年的努力,Electech Electronics成功开发出一系列具有竞争力的电子产品,如智能控制模块、高精度传感器等。这些产品的推出不仅拓宽了公司的产品线,也提升了公司的市场竞争力。

CIF公司的发展小趣事

D公司始终坚持品质至上的经营理念,以提供高品质的电子产品为己任。在CIF交易模式下,D公司严格控制产品质量,从原材料采购到生产流程中的每一个环节都进行严格把关。凭借出色的产品质量和良好的售后服务,D公司赢得了客户的信任和好评。

Allied Electronic & Semiconductor Technology Inc公司的发展小趣事

随着国内市场的饱和,AE&ST公司开始将目光投向全球。公司积极寻找国际合作伙伴,拓展海外市场。在一次国际电子展上,AE&ST与一家欧洲知名电子公司达成了战略合作协议。双方共同研发了一款针对欧洲市场的特色产品,并成功打开了欧洲市场的大门。此后,AE&ST公司不断深化与国际伙伴的合作,逐步实现了全球化布局。

固驰(GUERTE)公司的发展小趣事

近年来,固驰电子积极响应时代趋势和市场变化,不断加大技术创新力度。同时,作为REFLEK技术公司(又称Reflek恒昼科技)旗下的品牌,固驰(FlexiShield)还启动了品牌重塑计划,旨在以全新面貌引领行业未来发展方向。Reflek恒昼科技在金属隔热原膜及磁控膜领域拥有深厚的技术积累,其打造的FlexiShield固驰窗膜和漆面保护膜品牌迅速在市场上占据一席之地,进一步丰富了固驰电子的产品线。

ARCOLECTRICSWITCHES公司的发展小趣事

在技术进步的基础上,ARCOLECTRIC SWITCHES公司积极拓展国内外市场。公司通过与各大电子厂商建立合作关系,将产品广泛应用于家电、通讯、汽车等多个领域。同时,公司注重品牌建设,通过广告宣传和市场推广活动提升品牌知名度和美誉度。这些努力使得ARCOLECTRIC SWITCHES公司的市场份额逐年增长,品牌影响力不断扩大。

问答坊 | AI 解惑

新一代ASSP优化手持设备中的电源管理

本帖最后由 jameswangsynnex 于 2015-3-3 20:01 编辑 去年,消费者购买了十亿多部手机,2.2亿台笔记本电脑,1.4亿只MP3,9千万数码相机(DSC)以及1千万套个人导航设备(PND)。依据内部系统架构来说,所有的这些设备都有一定的共性。首先,它们都是由 ...…

查看全部问答>

LPC21XX + 网口

Connecting ethernet interface with LPC2000…

查看全部问答>

求单片机英文文献

求跟单片机有关的英文文献,最好有中文翻译?望各位大哥帮忙,万分紧急!…

查看全部问答>

调试嵌入式系统设计中的串行总线

调试嵌入式系统设计中的串行总线 今天,嵌入式系统几乎遍布在人类社会的每个角落。嵌入式系统可以简单定义为属于大型系统或机器一部分的一种专用计算机系统,其目的是为该系统或机器提供监测和控制服务。典型的嵌入式系统在开机时会开始运行某些专 ...…

查看全部问答>

工控机USB通信负载能力

我们经常利用工控机USB给产品download软件,但是一台工控机给最多只能查10条USB下载线分别给10台产品下软件,如何提升工控机效率,加DDR2都没有效果…

查看全部问答>

WinCE中HINSTANCE的问题

我想用一个HINSTANCE类型的全局变量hInst保存在WinMain函数中初始化过的hInstance对象,即:hInst = hInstance,调试的时候发现hInstance有值,而hInst没有,为什么啊?…

查看全部问答>

关于单片机的C语言

现在刚开始接触这东西 最近要弄一个8255的初始化(用C语言) 请问下是不是要先看C?或者是直接看单片机的C语言啊?…

查看全部问答>

发本UCOSII2.52的详细解释文档

   这个文档是以前在某个地方下的,一直与实践结合学习着。感觉是一篇非常不错的文档。。          里面对UCOSII的每一条语句都进行了解释说明,而且易懂。。      &nbs ...…

查看全部问答>

求助-----寻找433MHz RF 传输,接收IC

我现在有一个需求.要做一个RF遥控开关,只有一个控制按键,在欧洲使用,并且能在水下工作.请大家介绍一些这样的RF 传送介绍IC,越便宜越简单的越好.注意:这里的RF只做控制用,无数据传输等需求.谢谢…

查看全部问答>