历史上的今天
返回首页

历史上的今天

今天是:2025年02月02日(星期日)

2019年02月02日 | 手势识别:车内交互方式的新宠?

2019-02-02 来源:geekcar

从汽车被发明以来,人车交互的方式在不断变化。而在最近几年,这种趋势开始变得越来越明显。仅仅在车载信息娱乐系统中,交互方式也开始从最早的实体按键,转向包含按键、触屏以及语音等等方式在内的多维交互方式。

虽然交互方式在变,但遵从的逻辑从来都没变:方便与安全。比如扩大了手触面积的卡片式 UI、智能后视镜、抬头显示、智能 AI 语音、AR 导航等等,都是为了让驾驶员在开车的时候尽可能方便地传递指令,减少注意力的分散,保证安全。

图1

目前来看,车载语音交互已经比较普及,很多新车型上都有搭载。但它还是有自己的局限性,比如识别率、识别速度、对自然话术的支持等等都还不完善。这样一来,有时候反而会给驾驶造成额外的负担。

这时如果能像科幻片里那样,动动手指就能下达某些指令,可能会是一种更好的解决方案。

事实上,主机厂们也确实再往这个方向发展。2015 年,宝马率先发布了搭载手势识别的 7 系,而且前前后后也不断有 OEM 在尝试推出搭载这项功能的量产车(比如奔驰、拜腾、君马)和 demo(奥迪、福特、大众等),所以这更加深了我们对手势识别的好奇心。

手势控制正在成为一种更值得期待的车内交互方式。

图2

手势识别在车内都能做什么?

通过不同的手势,手势交互可以实现接挂电话、调节音量、选择歌曲、控制导航、控制车辆(空调、座椅、窗户等)等功能,还包括主驾和副驾、后排乘客交互的多种场景。

虽然手势控制能实现的功能不少,甚至和语音交互的功能还有一定重复。但是在我看来,手势和语音的关系绝不是非此即彼,一定是互相成就。想象一下,当你目视前方,用手指着天窗说打开,然后天窗就打开了,是不是还挺有意思的?

未来人机交互一定是多维度的。例如宝马全新 5 系就配备了「五维人机交互界面」,其中包括自然语音识别、手势控制、触控屏幕、iDrive 系统和热敏按键。

这种多模态交互才是未来。

另外,如果我们把视线从驾驶员的手势扩散开来,类似的技术在驾驶场景还能实现更多功能。

除了驾驶员的手势之外,手势识别的技术还能识别车外人员的动作。以后,这个功能也许还能识别交警指挥车辆的动作,或者周围骑自行车的人做出的手势。这样既能增加驾驶的安全性,又能促进自动驾驶的发展。

这些技术还可以实现驾驶员监测,是和目前手机的面部识别解锁类似的技术原理。从全球来说,法律规定在 L2 向 L3 级别的自动驾驶方案过渡时,驾驶员必须时刻监控车辆驾驶,所以随时监控驾驶员的状态在未来一定是必需的部件,而且这个未来很快就要到了。

既然手势交互和背后的技术对于驾驶有这么多帮助,所以我们有必要了解一下背后的原理。

图4

实现手势识别的 3 种方案

前方高能,所以请准备好开始烧脑。

根据硬件实现方式的不同,目前行业内所采用的手势识别大致有三种:光飞时间(Time of Flight)、结构光(Structure Light)以及双目立体成像(Multi-camera)。

光飞时间(Time of Flight):通过光的飞行时间来计算距离。

光飞时间的原理很简单,先用红外发射器发射调制过的光脉冲,再用接收器采集反射回来的光脉冲,最后根据往返时间计算物体间的距离,从而判断手势。

其实主要就是依据距离=光速*时间。光速是一定的,就可以通过时间差推算距离差。

图6

结构光(Structure Light):主动投射已知编码图案,再计算物体位置。

结构光要先通过红外激光器,将具有一定结构特征的光点投射到目标物体上,再由红外摄像头收集反射的结构光图案。

因为这些光斑投影在被观察物体上的大小和形状根据物体和相机的距离和方向而不同,所以根据三角测量原理可以计算出物体各个点的具体位置,根据前后位置差异从而能够判断手势。

图8

双目立体成像(Multi-camera):两个摄像头采集位置信息,再将畸变数据计算成可用数据。

双目立体成像非常依赖算法,而且算法的难度和分辨率和检测精度挂钩。分辨率和检测精度越高,计算就越复杂,还会导致实时性较差。它主要分两个步骤:1. 采集信息。2. 计算畸变数据。

1. 采集图像信息。通过两个摄像机提取出三维位置信息,并进行内外部参数的匹配。(摄像机本身存在畸变,如果不经过标定,原本的矩形会显示成不规则的圆角四边形)

2. 计算畸变数据。通过对比经过校准的立体图像,获得视差图像,再利用摄像机的内外参数进行三角计算获取深度图像,根据前后位置的区别进行手势识别。

图10

像分辨率、成本、测量精度这种问题,三种方案虽然有高有低,但基本都还说得过去,功耗在车内也不是大问题。

要判断哪种方案合适,要从以下几点着手:1. 是否能适应各种环境?2. 是否具有优异的实时性?3. 在样本范围内,数据误差是否可控?4. 成本是否可控?5. 体积是否可控?6. 硬件插件是否成熟?

前三点是非常重要的,因为汽车会处在各种环境内,所以抗干扰性、数据实时性、数据准确性非常重要。

结构光的分辨率高,计算量少,功耗也比较低,此前有很多成型的解决方案,还有 Inter 支持的 RealSense SDK,开发周期较短。但是它受限于主动投射的原理,非常容易受到强光和光滑平面(如镜子)的影响,室外基本不能使用,这点算是致命的。

双目立体成像的硬件成本比较低,但是它过于依赖图像特征匹配(后期计算),需要很高的计算资源。想要更高的分辨率,计算就越复杂,这就导致它实时性比较差。而且它在光照较暗、过度曝光或者场景本身缺少纹理的情况下,很难进行特征提取匹配。和结构光一样,在抗干扰性这点上它做的不好。

TOF 方案的分辨率很低,测量精度也不如其他两种方案,但是对于车内手势识别来说已经够了。因为需要光线的全面照射,所以功耗很高,但是这在汽车环境中也不算大事。而且它的体积可控;测量误差在整个范本内比较固定;虽然计算量大,但是算法难度较低;最重要的是它受外界环境干扰较小。综合来看,TOF 方案是个比较实用的选择,也是很多供应商都在努力的方向。

图12

目前都有哪些具体车型应用?

目前带有手势识别的量产车型有宝马、君马;正在计划量产的车型有拜腾、奔驰。

宝马家族的 7 系、5 系以及 X7、X5、X3 现在带有手势识别功能,其中 7 系是全球第一个装载手势识别的量产车型。它的手势识别区域为车机屏前方,供应商为德尔福,采用的是 TOF 方案,可以识别 7 种预设手势,包括接挂电话、选择歌曲、调节音量、控制导航等功能。

图14

而国内第一个配备手势控制的量产车型是众泰旗下的君马 SEEK5。它在 2018 年 8 月上市,可以识别 9 种动作,包括接挂电话、选择歌曲、调节音量以及一个小彩蛋:握拳手心向上打开变为手掌,界面会出现玫瑰花。

图16

拜腾在 2019 年底即将量产的车型采用了 48 寸的大屏。由于屏幕巨大,手势控制也作为其中必不可少的交互方式之一。它的供应商是国内的凌感科技,采用的是双目立体成像方案,可以识别 5 种手势,具体功能还没有公布。

图18

奔驰最新的 MBUX 采用了一种「非接触式」的控制方式,当手接近屏幕的时候,系统就可以感应到手部操纵了,所以不需要实际接触就可以使用屏幕。而且在全新 CLA 上,把手伸向后视镜就可以打开/关闭阅读灯,这个功能在阳光或者黑暗环境下都能使用。

根据最新消息,LG 将会为奔驰的一款车型提供手势识别系统,它可以实现巡航控制、调整音量等功能。LG 现在还在研发一种驾驶辅助系统,计划在今年末或明年初向戴姆勒交付。

图20

另外,还有一些 OEM 提出过自己的概念,但是目前还没有量产。

比如 2014 年,福特在 Mobbi 车载系统上展示过自己的 demo,可以实现控制空调、导航、音量、座椅位置等功能(供应商是英特尔,采用的是结构光方案);2015 年,奥迪在 CES 上用 Q7 展示了针对后排乘客的手势控制的 demo;2016 年,大众在 CES 上用 Golf-E Touch 概念车上展示过手势识别的 demo,采用的是 TOF 方案;2018 年,奇瑞在北京车展上展示了 LION 智能座舱,可以实现控制娱乐系统和地图。

图22

说了这么多车型和 demo,那手势识别在车内用起来到底怎么样?答案可能依然不尽如人意,原因其实不难分析。

首先,手势交互功能还在初期阶段,对于高识别率和防误触的界限很难界定。其次用户还没习惯手势交互的方式,更多时候会下意识的使用原有的交互方式。

当然,教育市场是每项新技术落地都必须要面对的,随着体验的升级以及更多车型的普及,这些问题也会逐渐消失。比如之前我也很不习惯用 Siri,但是现在我找不到 App 时就习惯让 Siri 帮我打开应用。我找不到手机的时候,也会满屋子的喊 Siri,直到它回应我「什么事?」。

图24

供应商在做什么?

目前,能够提供手势识别的不仅有大的 IT 公司以及 Tier 1(比如谷歌、德尔福、大陆、伟世通、微软、三星、Leap Motion 等),还有一些初创公司(比如未动科技、凌感科技、微动、极鱼科技、京龙睿信、光晕网络)。

这次我们重点挑几家国内公司,来看看他们是如何进行产品布局的。

未动科技(Untouch):

未动科技是一家智能视觉交互技术提供商,产品包括:3D 手势识别系统,智能驾舱解决方案、驾驶员监控系统。

2017 年 7 月,它发布了 4 款 3D 视觉交互产品:3D 手势识别产品:黎曼平台;3D 人脸识别产品:欧拉平台;SLAM 产品:笛卡尔平台;场景重建产品:高斯平台。

其 3D 手势识别产品「黎曼平台」可以基于深度图实现手部 23 个关节点识别与 26 自由度追踪,延迟在毫秒级。而且它还被全球著名的 TOF 深度传感器厂商 PMD 选择,作为中间件推出了一套完整的手势识别软硬件一体方案。

同时,其他产品还被应用在手机、机器人、无人机、AR/VR 等智能设备上。

它的核心竞争优势有两个:一个是构建了智能视觉交互技术的基础性平台,另一个是数以 PB 计的深度数据积累。

图26

凌感科技(uSens):

凌感科技专注于三维人机交互解决方案,是拜腾手势识别功能的供应商,采用的是双目立体成像方案。主要产品有:手势追踪、位置追踪、混合现实。

2014 年,uSens 就研发出全球第一个在有线及移动端实现基于 inside-out 技术路线的 26 自由度手势追踪以及 6 自由度头部位置追踪技术,可以通过识别手部 22 个关节点识别和 26 个自由度追踪。

2016 年,uSens 发布了 Fingo 手势交互模组,2017 年发布了新版 Fingo SDK。它可以识别 10 余种动态和静态手势,识别精度在 0.5cm-1cm,官方表示识别准确度可达 99%以上,可跨平台操作。还可以根据场景定义扩展新手势,并自定义相应功能。

2016 年,他们还与戴姆勒中国 IT 创新实验室一起展示了车载手势交互的新成果。通过他们的手势识别技术,体验者可以在 VR 场景中观察 3D 汽车模型的细节,还可以进行交互。

图28

微动(Vidoo):

微动以机器视觉和深度学习为核心技术,可以通过多种摄像头技术(IR 红外单目模组、IR 红外双目模组、RGB 单目模组)提供多种解决方案(提供 AR/VR 技术、车载手势控制方案、智能家居解决方案、虚拟触控解决方案)。

微动的手势控制采用的是双目立体成像方案,可以识别 8 种手势动作。

IR 红外单目模组可以应用在跑步机、抽油烟机、OTT 机顶盒上;IR 红外双目模组可以用在车载电子、VR\AR、广告终端;RGB 单目模组可以运用在无人机、智能新零售、智能手表上。

图29

极鱼科技:

极鱼科技是一家基于 TOF 手势交互技术实现人机交互的解决方案提供商,主要面向汽车市场。

它以手势为核心,同时还会结合眼球识别交互、面部识别、声音识别、光学技术、交互体验设计、人工智能等技术。它支持车厂自选 3-5 个手势并自定义功能,目前他们正在探索与天窗、座椅、车门之间的裸手交互。

2017 年它入选 Starup Autobahn 第一期加速营,从而获得了与戴姆勒合作的机会。

图30

行业总结以及对手势识别功能的愿景

从这些具体的产品或者 demo 上,我们能看到不论是 OEM 还是供应商,他们要的都不只是手势识别这一种功能,而是一个整体的智能驾驶座舱,里面涵盖了更多融合性的功能。

首先,手势识别必然会和语音识别等其他交互方式进行集成。供应商哪怕自己不做,也要和其他公司合作。比如思必驰、云知声等语音公司都投资了相关手势识别厂商。

另外,手势识别、语音识别和 HUD 结合也是一个不错的选择,所以也就出现了专门依托 HUD 来研发技术的供应商,比如京龙睿信和光晕科技。

依据手势识别的基础原理,还可以研发驾驶员监测等产品,这是 L2 向 L3 过度时期必不可少的一项功能。

所以很多供应商不仅仅只是提供手势识别的方案,它们还能提供其他相关产品,甚至涉猎到了智能家居、AR\VR 等领域。这其实是一件好事,这将有助于他们提供一套功能更加融合的的智能交互系统。

最后让我们回到手势识别本身。当我们在描述一家供应商的手势识别功能时,总是谈它能识别几种手势,好像能识别的越多就越厉害。但原则上供应商能实现 N 种手势,还能让 OEM 自定义功能。

所以车内手势控制不求多,更不求难,大家要的都是方便,又不是像阿汤哥拍《少数派报告》。

图32

真正的核心问题应该是,用户们到底能记住几种手势控制功能?又真正需要哪些功能?哪些手势的学习成本更低?哪些手势更容易上手?设置的手势动作符合人类的原始反应,才是 HMI 的第一原则。

说到底,我们现在车内的手势识别还处于发展初期,能实现的功能和准确率也很有限,但这并不能阻止我们对这一功能的憧憬。

总有一天,配合人脸识别、静脉识别、眼球识别,我们每个人都有一个超级 ID,进入车内中控台上的拟人化助手会通过全息影像的形式对你微笑,跟你说早安,我们在车内可以将手势识别、语音识别运用地流畅自如,通过前挡风的 AR 导航可以对周围状况一览无余,车内的大屏可以与工作的电脑连接,车内的智能化设备与智能家居也是共通的……

总之,这一定不是空想,而是未来。


推荐阅读

史海拾趣

Galil Motion Control Inc公司的发展小趣事

Galil Motion Control Inc. 的五个发展故事

故事一:技术创新引领者

Galil Motion Control Inc.,成立于1983年,位于美国加州硅谷中心,是电子行业中运动控制技术的先驱。公司成立初期,便致力于研发基于微处理器的精密运动控制器。据《DESIGNNEWS》杂志报道,Galil是全球第一家推出数字运动控制器的公司,这一技术创新在业界引起了巨大反响。此后,Galil不断推陈出新,其产品已发展到第五代,采用RISC结构的DSP技术,结合最新控制理论及网络技术,使得伺服更新速率和指令执行周期显著提升,引领了运动控制领域的技术潮流。

故事二:全球市场的扩展

随着技术的不断成熟,Galil的产品逐渐在全球市场上占据了一席之地。目前,全球有超过500,000台Galil的运动控制器在稳定运行,应用领域覆盖了医疗、半导体、纺织、物料搬运、食品加工、机床、产业机械、航天、测试测量等多个行业。这一广泛的应用不仅证明了Galil产品的可靠性和稳定性,也为其在全球市场的扩展奠定了坚实的基础。

故事三:分布式运动控制器的诞生

在进入21世纪之初,Galil公司又开发出了DMC3425分布式运动控制器。这款控制器不仅提供了API函数支持高级应用开发,还引入了极其简单易学的2字符命令集,使得应用编程变得如同书写英文字母般简单。这一创新不仅降低了用户的学习成本,也极大地提高了系统的开发效率,进一步巩固了Galil在运动控制领域的领先地位。

故事四:与光纤激光切割技术的结合

近年来,随着激光切割技术的快速发展,Galil公司也紧跟这一趋势,将运动控制技术与光纤激光切割技术相结合。通过设计以Galil控制卡为核心的四轴联动伺服控制系统,实现了激光切割设备的高精度控制。这一结合不仅提升了激光切割设备的性能,也拓展了Galil运动控制技术的应用领域,为工业制造带来了更多的可能性。

故事五:全球销售与服务网络的建立

为了更好地服务全球客户,Galil公司在全球范围内建立了完善的销售和服务网络。目前,Galil拥有众多销售代理商,遍布世界各地。这些代理商不仅负责产品的销售工作,还为客户提供专业的技术支持和售后服务。通过这一网络,Galil能够迅速响应客户的需求,确保每位客户都能获得最佳的产品体验和服务保障。这种以客户为中心的服务理念,也为Galil赢得了良好的市场口碑和广泛的客户认可。

Gems Sensors & Controls公司的发展小趣事

Gems Sensors & Controls公司始终致力于技术创新和产品研发。数十年来,公司不断推出新型号的液位、流量和压力传感器、微型电磁阀及预装射流系统等产品,以满足客户日益多样化的需求。这些产品凭借其卓越的性能和稳定的质量,在行业内赢得了广泛的赞誉和认可,也推动了整个传感器行业的进步和发展。

中科芯(CKS)公司的发展小趣事

人才是企业发展的核心驱动力。中科芯高度重视人才队伍建设,通过引进和培养高素质人才、优化人才结构等措施,不断提升公司的创新能力和竞争力。同时,公司还创新激励机制,通过“揭榜挂帅”等形式吸引和激励人才投身重点项目的研发攻关。这些措施的实施不仅激发了员工的积极性和创造力,也为公司的持续发展提供了有力保障。

以上五个故事分别从中科芯的技术创新、科研成果、业绩增长、产品推广和人才队伍建设等方面展示了公司在电子行业中的发展历程和取得的成就。这些故事不仅展现了公司的实力和潜力,也体现了公司对社会和行业发展的贡献和担当。

Britool Expert公司的发展小趣事

在技术创新方面,中科芯不断推出具有竞争力的新产品。其中,CKS32系列MCU是公司近年来推出的一款高性能微控制器产品。该产品具有高可靠性、高兼容性和高性价比的特点,在市场上广受好评。在苏州先进技术成果交易大会上,CKS32系列MCU以其卓越的性能和广泛的应用领域吸引了众多关注。该产品的推出不仅提升了中科芯在微控制器领域的市场地位,也为中国电子行业的发展注入了新的活力。

Allen Avionics Inc公司的发展小趣事

近年来,面对全球芯片市场的激烈竞争和内外部环境的挑战,中科芯坚持创新驱动发展战略,加大市场开拓和科技攻关力度。通过优化产品结构、提升产品质量和降低成本等措施,公司实现了营业收入和净利润的稳步增长。一季度,中科芯的营业收入较正常年度增长24%,净利润增长83%,新签合同增长50%以上。这一成绩的取得充分展示了公司的市场竞争力和发展潜力。

Communications公司的发展小趣事

在电子行业的跨界融合趋势下,一家名为“智联通信”的公司通过整合不同领域的技术和资源,成功打造出了一个全新的通信生态系统。他们不仅拥有先进的通信技术,还积极与互联网、物联网等领域的企业进行合作,共同开发新的应用场景。

通过跨界融合,“智联通信”成功地将通信技术应用于智能家居、智慧城市等多个领域,为用户提供了更加便捷、高效的服务体验。同时,他们还积极拓展海外市场,与全球伙伴共同推动通信行业的发展。

问答坊 | AI 解惑

【ISSCC】美国UCLA新型软件无线RF芯片,融合宽带电路与离散时间处理功能

美国UCLA(University of California, Los Angeles,加利福尼亚大学洛杉矶分校)和美国WiLinx公司在日前召开的“ISSCC 2006”会议上发表了面向软件无线设备的宽带接收IC。该芯片支持800MHz频带~5GHz频带,可满足IEEE802.11g、GSM、CDMA和W-CDMA等 ...…

查看全部问答>

LCD12864的资料

LCD12864带汉字库的资料 [ 本帖最后由 西门 于 2009-5-12 19:54 编辑 ]…

查看全部问答>

倒车雷达的超声波测距最简单的单芯片控制方案

倒车雷达的超声波测距最简单的单芯片控制方案 GM3101 是专用于倒车雷达的超声波测距芯片,该芯片提供4 路超声波探头的驱动,并根据超声波特性和倒车雷达的使用环境进行了一系列智能化处理,在保证超声波测距精确性的基础上,更加强了报警功能的准 ...…

查看全部问答>

工程师在FPGA设计中面临的挑战?大家来谈谈吧!市场需要?绿色设计?

最近的新闻常看到Xilix出了65ns工艺的FPGA,Altera也推出40ns的收发器FPGA,工艺不断提高,容量不断扩大,加入的IP核也越来越多,但实际FPGA设计中,工程师选择FPGA中考虑的是什么呢?       第一个个应该是市场吧,市场需要 ...…

查看全部问答>

Searl Effect Technology and the inventor of the Searl Effect Generator (SEG)

塞尔效应技术及塞尔效应发电机的发明者 PART 1:  The Searl Effect Generator (SEG) has the functional resemblance to a linear induction motor (LIM) designed on a vertical track, rounded and joined at the ends for continuous motion ...…

查看全部问答>

marvell 8688 wifi驱动

有谁做过marvell 8688 wifi的驱动,我用的是SPI接口,平台是三星的2440,怎么加载上GSPI8688_WLAN.dll后。winCE上不能正确出现正常的网络连接。…

查看全部问答>

S3C2440A主频怎样从400M提高到533M?

哪位大虾能给指点一下?谢谢! 我现在修改了bsp_cfg.h中的S3C2440A_FCLK和startup.s中的MPLL,结果内核启动到初始化NandFlash之前就挂了.…

查看全部问答>

新人提问,,请大家帮帮忙,关于windows Embedded

我用的是华为的MAS.里面采用的是Windows Embedded  sp1 问题有几个 第一个是 我想装一下IIS,可是添加删除里面无法安装.我应该怎么操作 第二个是 华为MAS的某些自带的程序可能组件化了.我该如何停止掉呢 第三个是 我打SP2补丁上去好像 ...…

查看全部问答>

发个收藏的ST7920核心的12864程序集合吧~

这是我最近在网上找的关于12864 ST7920核心的程序集合,里面的程序比较多,希望对大家有帮助…

查看全部问答>

CCSv4.0.2,32k限制版

CCSv4.0.2,32k限制版安装完成后,说是此版本没有自带XDSv2的驱动。之后给出更新方法,但是在URL的框输入http://software-dl.ti.com/dsps/dsps_public_sw/sdo_ccstudio/CCSv4/Updates/XDS100V2/site.xml,更新提示说URL错误。 谁能提供一个正确的UR ...…

查看全部问答>