历史上的今天
返回首页

历史上的今天

今天是:2025年01月12日(星期日)

2021年01月12日 | 音频前端和唤醒词检测:Alexa参考设计中的关键注意事项

2021-01-12 来源:EEWORLD

设计工程师可以利用硬件模块和软件服务将Alexa语音服务(AVS)集成到智能家居,汽车和可穿戴设备中。它将基于云的Alexa体验带入了从便携式扬声器到智能设备再到车载信息娱乐的产品。开发人员可以将Alexa集成到其基于语音的产品中,并编写配套的应用程序以将产品转换为连接的产品。


自亚马逊于2014年将原始的Alexa设备推向市场以来,亚马逊网络服务(AWS)以及多家芯片制造商都推出了参考设计,这些参考设计可通过提供预先构建和预先测试的设计来帮助工程师集成亚马逊的语音识别技术和AVS接口。


因此,如果您的公司没有太多的工程师从事硬件和软件开发,则参考设计可简化基于Alexa的设计的简单且经济高效的自然语言理解和语音界面的开发。否则,高质量音频处理的集成会使启用语音的设备的开发既冗长又复杂。


image.png?imageView2/2/w/550

图1基于AVS的语音应用程序参考设计,旨在将Amazon的语音识别技术无缝集成到语音控制设备中。资料来源:意法半导体


唤醒词检测


这一切都始于强大的唤醒词引擎(WWE),该引擎在系统采取任何措施之前会侦听关键字“ Alexa”。有一个基于云的唤醒词验证,可以验证上下文并确保用户真正需要Alexa。在此,参考设计的语音捕获部分通过在实际条件下执行音频捕获来增强“ Alexa”唤醒词检测。这样设计人员即使在中等距离下也可以抵抗干扰嘈杂的环境。


以Cirrus Logic用于Amazon AVS应用程序的语音捕获开发套件为例;它通过经过验证的硬件和软件组件提供声学调谐。该套件即使在用户离设备几米远的情况下,也可以在安静和嘈杂的环境中改善“ Alexa”唤醒词检测。它通过抑制噪声和其他实际干扰来实现更准确和可靠的语音交互。


image.png?imageView2/2/w/550

图2远场AVS参考设计,针对智能扬声器和其他语音控制的智能家居设备。资料来源:Cirrus Logic


如上所示,该套件包括一个带有两个麦克风阵列的语音捕获板,Raspberry Pi3(RPi3),扬声器和一个预装有所需固件的microSD卡,以实现即时生产。控制台简化了各种RPi3应用程序的操作,并提供了用户友好的界面来执行声学调谐和诊断功能。


语音捕获板集成Cirrus Logic的CS47L24智能编解码器,CS7250B数字MEMS麦克风和SoundClear算法,用于语音控制,噪声抑制和回声消除。在这里,智能编解码器集成了高保真DAC,立体声耳机放大器和单声道扬声器放大器,以减少电路板面积和物料清单(BOM)。


接下来,具有超低本底噪声和103 dB的宽动态范围的MEMS麦克风可确保在具有挑战性的噪声条件下精确捕获语音。最后,SoundClear算法可以阻止可能干扰Alexa唤醒字的噪声。


这使该工具包即使在嘈杂环境中的中等距离下,也可以在现实环境中有效执行“ Alexa”唤醒词检测和音频捕获,从而使用户能够可靠地中断响亮的音乐或Alexa响应播放。


音频前端


基于AVS设计中的基本硬件包括多个麦克风和音频前端(AFE),可确保在安静和嘈杂的环境中检测“ Alexa”唤醒词。这使得音频前端成为任何AVS参考设计的关键组成部分。


音频前端拾取用户的声音,进行放大,降低背景噪音,然后将其发送到云端。这很难做到,因此,使用开发套件是创建音频前端的好方法。


以TalkCon为例,DSP Concepts的音频前端具有经过AVS认证的集成语音处理功能;它已针对意法半导体基于芯片制造商STM32 MCU的AWS IoT核心参考设计推出。TalkTo音频前端具有降噪,回声消除和基于先进波束形成的信号处理功能,可用于远场音频检测。它通过Audio Weaver提供,Audio Weaver是一个免费工具,可帮助开发人员微调AVS设计。


image.png?imageView2/2/w/550

图3一种包含音频前端处理,本地唤醒字检测,通信接口以及包括RAM和闪存在内的存储器的单芯片解决方案,可降低BOM成本并简化布局。资料来源:意法半导体


ST的36×65毫米电路板将Wi-Fi模块与STM32H743 MCU集成在一起,该STM32H743 MCU集成了音频前端程序评估,本地唤醒字检测,通信接口和单个芯片中的存储器。该参考设计硬件还包括一个音频子板作为单独的模块,以进一步简化开发和原型制作。


子板包括FDA903D音频编解码器,LED和按钮,以及两个间距为36 mm的MP23DB01HP MEMS麦克风,用于尺寸受限的设计。这也使开发人员可以采用隐私模式来关闭麦克风,因此红色LED可以通知用户Alexa无法接受语音命令。


远场语音识别


其他芯片制造商也加入了参考设计,这些参考设计集成了亚马逊的远距离语音识别技术。例如,恩智浦(NXP)推出了一个参考平台,该平台声称即使在播放响亮的音乐时也能从整个房间识别用户的请求。


恩智浦针对Amazon Alexa的参考平台包括7麦克风阵列设计,音频处理算法和波束赋形技术。它将亚马逊的远距离语音识别技术与恩智浦的i.MX应用处理器集成在一起,旨在简化语音控制设备的创建。


诸如Alexa之类的具有语音功能的设计改变了用户与智能事物交互的方式,从烤面包机到炊具,恒温器到百叶窗。在这里,参考板和语音捕获套件为各种支持Alexa的产品提供了最快的上市途径,同时即使在嘈杂的环境中也能确保高精度的唤醒字触发和命令解释。


我们正处于语音使能设备革命的起步阶段,这些应用程序的多样性意味着预先设计和预先测试的参考板和套件可能会发挥重要作用。他们对于将语音功能产品更快推向市场并绕过其设计复杂性至关重要。


推荐阅读

史海拾趣

Gems Sensors & Controls公司的发展小趣事

Gems公司的首次商业成功源自一款专为小型造船业设计的舱底开关。这款产品的推出迅速得到了船舶和工业界的认可,不仅为公司带来了可观的收入,也奠定了Gems在传感器市场的地位。随着产品的广泛应用,Gems的员工数量和设施规模不断扩大,厂房从最初的6,500平方英尺扩展至位于美国康涅狄格州普莱恩维尔市的60,000平方英尺,为公司后续的发展提供了坚实的基础。

Barkston Plastics Engineering Ltd.公司的发展小趣事

随着智能化技术的快速发展,Barkston Plastics Engineering Ltd.意识到传统生产方式已无法满足市场需求。于是,公司开始进行智能化转型,引入先进的生产设备和自动化管理系统,提高生产效率和产品质量。同时,公司还加大了对研发创新的投入,推出了一系列智能化塑料电子元件产品,成功实现了产业升级。这一转型为公司带来了新的发展机遇,也使其在电子行业中保持了领先地位。

以上五个故事是基于电子行业背景为Barkston Plastics Engineering Ltd.构建的发展故事,旨在展示其在不同历史阶段的重要发展节点和成就。这些故事均遵循事实性描述的原则,不包含任何褒贬评价。请注意,这些故事是虚构的,仅用于示例目的。

柯爱亚(ceaiya)公司的发展小趣事

为了保持技术领先地位,柯爱亚不断加大研发投入,引进先进的研发设备和人才。公司在功率电感、变压器等领域取得了多项技术成果,并申请了多项专利。这些技术成果不仅提升了柯爱亚产品的竞争力,还推动了整个电子行业的发展。

CDIL[Continental Device India Pvt. Ltd.]公司的发展小趣事

随着市场竞争的加剧和技术的不断进步,CDIL在15年前作出了重要决策——退出晶圆制造,转而专注于IC封装和电子制造服务。这一转型不仅使CDIL能够更好地适应市场需求,也为其带来了更广阔的发展空间。如今,CDIL的IC封装技术已达到国际先进水平,为全球众多知名电子企业提供优质服务。

DL Instruments LLC公司的发展小趣事

DL Instruments的成功离不开其领导层的智慧与远见。David Woolston先生作为公司的创始人之一,凭借其丰富的行业经验和敏锐的市场洞察力,带领公司不断突破自我、超越竞争对手。他注重人才培养和技术创新,为公司的发展奠定了坚实的基础。

ESTEK公司的发展小趣事

在电子行业日益注重环保的背景下,ESTEK公司积极响应号召,致力于研发和生产绿色环保的电子产品。公司投入大量资金和资源,研发出了一系列符合环保标准的电子元件和设备。这些产品在市场上受到了广泛欢迎,不仅为公司带来了可观的经济效益,也为环保事业做出了积极贡献。

问答坊 | AI 解惑

手机电路中的特殊元器件

一、开关元件 开关、干簧管和霍耳元件都是用来控制线路的通断的器件。不同的是开关一般是人工手动操作的,而干簧管和霍克元件则是通过磁信号来控制线路的通和断。 1.开关 在手机中使用的开关通常是薄膜按键开关,它由触点和触片组成。按键的两个 ...…

查看全部问答>

单脉冲序列对双激式开关电源变压器铁心的磁化开关电源原理与设计(连载53)

2-1-1-4.脉冲序列对双激式开关电源变压器铁心的磁化 双激式变压器与单激式变压器的区别主要是两者输入电压的参数不一样。单激式变压器输入的电压是单极性直流脉冲,而双激式变压器输入的电压是双极性交流脉冲。为了简单起见,我们把双激式变压器 ...…

查看全部问答>

数字视频监控硬件设计经验谈

数字视频监控系统主要包括DVR、DVS、IP-Camera等,涉及到嵌入式系统技术、视频编解码技术、音频编解码技术、联网及域名处理技术等。硬件对于系统而言,相当于建筑的地基,地基牢,建筑才可靠,才能够经历风风雨雨的考验。     概述 & ...…

查看全部问答>

IOCTL CODE DeviceIoControl

我做摄像头的数据采集,用CreateFile打开设备,然后调用DeviceIoControl函数,第二个参数需要的是控制CODE,这个CODE需要驱动来提供?不是标准调用吧。如果驱动没有提供读数据的控制CODE,那我是不是就没有办法用DeviceIoControl得到数据了?…

查看全部问答>

vhdl, 怎么实现让输出维持一段时间后撤销

vhdl, 怎么实现让输出维持一段时间后撤销~~~~~ 请大侠,帮忙~…

查看全部问答>

PCI 接口 IO读写 驱动

driverStudio 生成的驱动程序 实现 IO读写功能 驱动程序代码中两个操作如下: NTSTATUS RW6070Device::RW6070_IOCTL_800_Handler(KIrp I) {         NTSTATUS status = STATUS_SUCCESS;         //t …

查看全部问答>

stm32sd卡咨询

                                 各位大侠请问,stm32有没有通过spi读取sd卡的例程,或者哪位大哥自己做过这一块可以指点一下小弟,我刚开始做这一 ...…

查看全部问答>

ST中国微控制器中文下载怎么都挂了?

                                 RT…

查看全部问答>

RT-Thread开源实时操作系统/STM32F103VB0.3.0b3版本

这个版本更新有些多,RT-Thread/STM32F103VB 0.3.0 beta3更改记录:- 内核,添加IAR EWARM 5.x工程,在内核定义中做相应的平台定义;- 添加文件系统组件DFS,DFS是一套虚拟文件系统(类似Linux的VFS,但几乎不占 ...…

查看全部问答>

有关2812的资料其寄存器都没有地址,谁那有?

有关2812的资料其寄存器都没有地址,所见的都是C语言的头文件,用了结构体和共用体,找不出起物理地址了,想用一段汇编,找不到外设和寄存器的地址,没法编那.谁有这方面的资料?或给指点一下…

查看全部问答>