[讨论] [转]实现手势识别:摄像头VS超声波麦克风?

azhiking   2015-5-13 09:15 楼主
手势识别技术的走红离不开一批成功的体感游戏设备,各大半导体厂商推出不同原理的手势识别方案,其中应用最为广泛的是多在游戏设备中利用摄像头实现计算机视觉,但其他方案例如红外识别、电场识别、以及超声波识别也在不断推出新的产品与技术。
之前或许您已经听说过利用超声波麦克风进行手势识别,但很多工程师可能还会认为这是停留在实验室的项目,事实上,利用超声波进行手势识别的方案已经相当成熟,而且有其独特的优势。

数字超声麦克风的出现

麦克风录音时是不分频率的,只要有物体振动,它就可以把振动的频率录下,包括人耳听不到的超声波,所以理论上使用麦克风进行超声波识别是不需要再增加额外器件的,只要覆盖到足够的频谱即可。

“模拟麦克风也可以收到超声波信号,而普通PDM数字麦克风的量化噪声在20~30KHz以后会变得非常高,超声数字麦克风则通过放大有用信号来提升信噪比,我们在这方面有很多IP。”楼氏电子AAS技术产品营销高级经理兼移动消费电子产品应用负责人Oddy Khamharn指出,另外数字超声麦克风也显著降低了功耗。

另外,超声波麦克风走向数字化还有一个因素驱动,那就是设备缺少足够的模拟端口。一般手机或平板只有2个模拟端口,而像是要获取足够的精度需要使用8颗麦克风的时候,就只能采用数字超声麦克风了,Khamharn补充道。

在数字超声波麦克风出现后,由于对环境光线没要求(黑暗中也能精准感测)、很容易测得距离/景深等特殊性能,有先见的系统公司纷纷采用该技术实现一些特有的手势识别、距离感应等应用。Khamharn指出超声波的方案性能相对更稳定且成本更低,特地对比了超声波麦克风和目前主流传感器的性能对比,如表一所示。
20150505-microphone-1.jpg
“多个超声波麦克风组合还可以实现更好的精度。”Khamharn表示。例如,我们已经看到有的应用使用了七颗麦克风——5颗实现手势识别,而另2颗则提供给音频用。
麦克风新玩法:更低成本的实现创新应用

事实上,在不同应用环境中,超声波麦克风可是实现通过上述独特的特性带来意想不到的创新应用。楼氏的工作人员演示了一个Demo,笔记本内置的麦克风阵列能在三个维度准确识别到手的位置,小球的位置和大小(手距离屏幕的距离不同则球大小不同)都会变化。就是这个简单的原理,已被工程师用于多种应用。
20150505-microphone-2.jpg
手机中:超声波麦克风可以取代红外接近传感器,这是最简单的一个应用。“设计者不仅可以少用一个器件,而且不需要再专门为红外传感器开个孔。”Khamharn表示,“这个孔在制造工艺上精度要求很高,也存在额外的成本。”

平板中:下图为HP新推出的平板电脑,该平板配备Duet Pen手写笔,通过笔尖上方的超声波发射器以及内置在平板中的多个麦克风阵列追踪手写轨迹。这种方案比红外线准确,比触摸材料方便。
20150505-microphone-3.jpg
无人机:已有欧洲及本土的无人机公司采用了超声麦克风来进行无人机定位及躲避树木等障碍物,据称在可靠性方面得到了突破。

或许利用超声波来实现上述部分功能还没有计算机视觉那么成熟,但是同时超声波利用其独特的方式为开发者打开另一扇创新的窗户, Khamharn指出,已经有处理器芯片厂商已有搭载支持楼氏超声麦克风算法的主芯片推出,我们相信这一举措会更加推动该技术的普及。

在深圳举办的研讨会更好的贴近深圳地区的客户,“这里创新型的小公司特别多,而超声麦克风的方案给了他们更大的创意空间。”Khamharn表示。

附录:数字超声波麦克风性能参数

楼氏电子的MEMS超声波数字麦克风SPH0641LU4H-1尺寸仅为3.50 x 2.65 x 0.98 mm,可通过多片组合的方式达到更好的精度。

产品特性:

支持超声波频率

高信号频带宽灵敏度高

业界最低功耗(仅为竞争对手的1/3)

单位面积内最佳声学表现

多工作模式(睡眠、低功耗、标准模式以及超声波模式)

高信噪比

更简单的系统集成以及更好的抗干扰能力

具体参数:

超声波频率:高达80kHz

信噪比:64.3dB

功耗:低功耗模式下为235uA

尺寸:比同类产品低20%

灵敏度:-26+/-1dB @ 1KHz

回复评论 (7)

楼主说的这样,后面的还能明白一些,但实现手势识别就是搞不明白是怎么实现的。实现这个手上要有超声波发生装置吗
点赞  2015-5-13 09:32
引用: dj狂人 发表于 2015-5-13 09:32
楼主说的这样,后面的还能明白一些,但实现手势识别就是搞不明白是怎么实现的。实现这个手上要有超声波发生装置吗

个人觉得就是通过超声波麦克风阵列,通过一定的算法去实现的。有点类似于雷达的原理,各个mic接收到反射的声波是有时间差的,根据时间差来模拟出一种形状,所以理论上阵列中的麦克风越多,模拟出来的形状就越精确,就像COMS传感器的像素一样。
点赞  2015-5-13 09:55
引用: azhiking 发表于 2015-5-13 09:55
个人觉得就是通过超声波麦克风阵列,通过一定的算法去实现的。有点类似于雷达的原理,各个mic接收到反射的声波是有时间差的,根据时间差来模拟出一种形状,所以理论上阵列中的麦克风越多,模拟出来的形状就越精确,就像COMS传感器的像素一样。

以阵列的形式实现会提高成本吗,为什么不采用陀螺仪、加速度和电子罗盘的组合呢?
点赞  2015-5-13 20:24
引用: dj狂人 发表于 2015-5-13 20:24
以阵列的形式实现会提高成本吗,为什么不采用陀螺仪、加速度和电子罗盘的组合呢?

这种识别不是需要一个体感设备之类的进行识别,而是可以识别“任何”经过的物体。

你说的这种方案是需要一个“外围设备”才行。



比如说在显示器周围放上几个超声波麦克风,通过这种方案,你的手不用触摸到屏幕

就可以对屏幕上的元素进行操作(有点像科幻片啊)。而不是说手里拿个“3D鼠标”进

行操作。



个人认为,这个技术成熟后,很能改变我们现在的交互操作方式。
点赞  2015-5-14 09:10
引用: azhiking 发表于 2015-5-14 09:10
这种识别不是需要一个体感设备之类的进行识别,而是可以识别“任何”经过的物体。

你说的这种方案是需要一个“外围设备”才行。



比如说在显示器周围放上几个超声波麦克风,通过这种方案,你的手不用触摸到屏幕

就可以对屏幕上的元素进行操作(有点像科幻片啊)。而不是说手里拿个“3D鼠标”进

行操作。



个人认为,这个技术成熟后,很能改变我们现在的交互操作方式。

可以理解为麦克风阵列方案属于动作捕捉,而陀螺仪等的方案属于附着式的吗。这样的话,前者的发展前景确实比后者要好点
点赞  2015-5-14 11:56
引用: dj狂人 发表于 2015-5-14 11:56
可以理解为麦克风阵列方案属于动作捕捉,而陀螺仪等的方案属于附着式的吗。这样的话,前者的发展前景确实比后者要好点

可以这么说吧
点赞  2015-5-14 12:42
请问这种设备能够对手部的动作进行精确捕捉吗?需要将手摆放在特定的位置进行操作么?
点赞  2015-5-17 23:21
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 京公网安备 11010802033920号
    写回复