历史上的今天
今天是:2025年01月22日(星期三)
2021年01月22日 | 苹果研究如何利用音频来估计设备与说话用户的距离
2021-01-22 来源:cnBeta
新专利显示,苹果正在研究HomePod或其他设备如何利用音频来估计与说话用户的距离,还可以识别周围的声音。苹果的HomePod已经很好地听到了你的声音,即使是在大声播放音乐的时候。现在新专利申请显示,苹果希望改进这一点,并将设备的听觉能力,提升到一个新的水平。
一项是名为 “基于学习的距离估计”的专利,涉及到使用音频不仅仅是为了识别用户,而是为了弄清用户的位置。苹果在专利当中表示,设备使用紧凑麦克风阵列估计设备到用户的距离,例如,设备可以根据用户与设备的估计距离来调整播放音量或智能辅助设备的响应。因此,如果用户离设备非常近,音乐或语音将不会以高音量播放,另外,如果用户离得很远,媒体播放或智能助理设备的响应可能会被调整到更大的音量。
这个想法也是为了改进苹果目前令人印象深刻但又有些缺陷的系统,即多个苹果设备都会尝试确定你对哪个设备说了 “嘿,Siri”。对此,苹果在专利当中表示,在有多个设备的应用场景中,设备之间可以相互协调或仲裁,根据每个设备到用户的距离来决定哪一个或多个设备应该回复查询。
在专利当中,苹果提出了简单和更复杂的解决方案,这些方案都可以协同使用。比较简单的是让设备像HomePod一样,先绘制出环境图。然后,它有效地拥有一个声学环境中的测量或模拟点的网格。在这种情况下,就可以将声音与这个 “网格 ”进行对比,从而大致判断出说话的人所在的位置。
如果这不够好,苹果还有另一个解决方案,它涉及 “基于学习的系统,如深度神经网络(DNN),而且不需要多个设备互相协调帮助。苹果在专利当中表示,深度学习系统可以根据紧凑的麦克风阵列接收到的语音信号,估计语音源在每个时间段的距离。这个DNN系统可以做的是确定什么是语音,什么是背景噪声。然后,它可以计算出 关于直接信号传播的信息,还可以计算出混响效应和噪声。
史海拾趣
|
摘要: 本文介绍了一种基于32位高性能处理器的视觉精密测量系统的软硬件设计。图像传感器采集的条码图像通过精密定位算法得到绝对位移值,由以太网接口实现高速图像采集。该系统适用于高精度定位的各种位移测量。 关键词: ARM;嵌入式系统;视觉 ...… 查看全部问答> |
|
NXL LPC系列ARM IIC总线下读写AT24Cxx的总结 最近应用到NXP LPC系列的ARM IIC总线进行读写AT24Cxx EEPROM,总是出现一下错误,经过查阅资料才发现,原来本人范的全是最基本的错误,感觉很惭愧,现在把容易出错的地方进行总结,希望网友遇到这样的问题时 ...… 查看全部问答> |
|
最近在思考一个问题,就是有关SD卡升级的。 我看到过三星发布2442下的SD卡升级,但有个缺陷是只支持FAT格式的小容量卡,而且,在EBOOT里面去读写卡的block、sector,简直有点复杂。 我在想,如果是FAT32格式的(现在基本上都是FAT32格式了)SD卡能 ...… 查看全部问答> |
|
int tmp,i,j; int receiv,send=0x30; *ULCON0=0x03; *UCON0=0x09; *UBRDIV0=0x280; ...… 查看全部问答> |
|
从原理上来说..如果用FSMC驱动彩屏..就是把它当作一个外部的存储器件来操作. 1)只有16bit数据线是不是代表每像素就是16bit的?2)需要LCD内带控制器的屏才可以..这样选型范围应该会缩小很多.而且会贵这种屏一般上批量的话能做到多少钱一片. ...… 查看全部问答> |
|
用的是103F的片子,想把TIM1设置成翻转输出比较模式,但端口不会发生翻转 配置程序如下: GPIO_Init(GPIOC, GPIO_PIN_6, GPIO_MODE_OUT_PP_HIGH_FAST); TIM1->CR1 &= 0xFE; // stop TIM1 TIM1->PSCRH = 0; TIM1->PSCRL = 0; ...… 查看全部问答> |




