随着智能技术的不断进步,会议终端设备正朝着更加智能化的方向发展。这一趋势在家庭和办公场所尤为明显,人们追求更智能的会议终端,以提升会议的效率和用户体验。智能语音功能已经广泛应用于会议音频设备中,其中最为著名的应用之一是语音助手。自从苹果推出SIRI以来,智能语音互动应用得到了迅猛发展。
为满足这一趋势,Realtek的智能语音服务解决方案,基于语音输入实现了新一代的互动模式,用户只需通过说话就可以获得所需的结果。该解决方案采用了ALC5679/80系列芯片,并配备了扬兴YSO110TR 24.576MHz的有源晶振和YST310S 32.768KHz的表晶,该方案为市场上性价比较高的智能语音服务解决方案之一。
【方案优势】
1.体积小、功耗低、高效能、整合Wi-Fi功能的微型处理器Ameba系列产品。
2.结合第三代音效处理编译码芯片ALC5679/80系列。
3.内建四种音效处理DSP(回音消除、盲讯号分离、远距离拾音、噪声抑制),有助提升音质。
4.有配套的语音算法,也有配和第三方语音唤醒算法(wake-on-voice),提供绝佳的声音处理效能。
【产品实体图】-会议音频终端
会议音频终端外观 会议音频终端电路板
【方案框图及解析】
1.声卡方案组合
声卡芯片方案是按照需求来选择的,瑞昱声卡芯片高度整合多麦克风语音处理方案轻易升级各种产品与应用实现语音控制、语音互动或语音唤醒功能。
ALC5680:免持(0m~ 3m)应用之双麦克风处理解决方案
ALC5521:远距(5m~ 7m)应用之多麦克风处理解决方案
完美覆盖会议音频终端的应用场景
2.采集阵列
这里的采集阵列实际上为麦克风阵列,是由一定数目的麦克风组成,对声场的空间特性进行采样并滤波的系统。
目前常用的麦克风阵列可以按布局形状分为:线性阵列,平面阵列,以及立体阵列。
AD转换流程
3.ADC模块及MCU模块
ADC和MCU模块是组合在一起的一颗单片机芯片,主要是把经过放大的模拟信号转化成数字信号,主要经过四个步骤:采样、保持、量化、编码,经过处理后的信号,才能转化为符合音频解码规则的数字电信号。使用扬兴科技晶振YST310S 32.768KHz,215=32768,15次分频后就是1HZ,周期为1S,这样就可以为分频计数器提供精确的与低功耗的实基信号,如图实际频率偏移为17ppm,频差偏移根据芯片要求,一般在±50PPM以内。
YST310S 32.768KHZ的实际频偏 YST310S 32.768KHZ实物图
4.声卡芯片
数字信号是按特定的编码规则组成的信号,需要专门的解码芯片去处理,最后转化成人们熟悉的声音,此时为了保持音频同步的问题,选择在声卡芯片外置一颗扬兴有源晶振YSO110TR 24.576MHZ,语音数据分左右声道数据,LRCK(采样时钟)的时钟一般有16KHZ、32KHZ、48KHZ;系统的主时钟MCLK(过采样时钟)根据采样频率一般为采样频率的128、256、512倍,为了分频方便许多声卡芯片选择24.576MHZ的晶振。为了实时的音频输出,声卡要求主频的频率偏移一般都在±30PPM以内,样机上YXC晶振的输出频率偏移为-5.2PPM,非常符合芯片设计需求。
YSO110TR 24.576MHZ的实际频率 YSO110TR 24.576MHZ实物图