历史上的今天
返回首页

历史上的今天

今天是:2024年12月18日(星期三)

正在发生

2018年12月18日 | 不只有结构光:机器眼中的立体世界 还在发生若干变化

2018-12-18 来源:亿欧网

要说AI技术里什么最火,机器视觉绝对算一个;而要说机器视觉技术里什么最火,大概毫无争议就属3D机器视觉了。

所谓3D机器视觉,是指在一般的机器视觉技术的基础上,加入对立体空间中三维模型的理解。这项技术不仅涉及AI,而是一门机器视觉、图形学与数据感知技术的交叉学科。想想也知道,让机器认识3D画面是非常有价值的。毕竟人的视觉理解就是3D的,想要让AI尽量贴近真人的感知方式,3D是必须攻克的难题。

在产业场景上,3D机器视觉是无人驾驶和高精地图的重要技术条件,在VR/AR上应用也非常广泛,而无人机航拍与测绘也离不开这门技术。在苹果把3D结构光技术炒火了之后,手机中的3D机器视觉也已经成为兵家必争之地——假如说,这些厉害的技术都是赛车,那么3D机器视觉就是他们在路上都会遇到的收费站……

今天在机器视觉顶会中,差不多会有半壁江山那么多的论文都是跟3D有关。前沿探索可谓疯狂进行。然而重点来了,关于这一领域,似乎大部分吃瓜群众还是只知道一个结构光而已。

有哪些三维图像+机器视觉的新技术趋势,今天正隐藏在未知迷雾中眺望这个世界?今天我们来说几种很有科幻感的技术突破点。说不定这些能力明年就会出现在你的手机、VR设备和无人机中,又或许即将成为某个被资本疯狂亲吻的创业热潮。

超大场景的3D数据感知

3D机器视觉包括很多方面,既有让智能体去理解3D数据,也包括如何通过机器视觉的解决方案,去获取3D模型数据。

传统意义上的3D数据获取,或者称其为3D感知技术,一般来说可以利用多角度拍照或者深度传感器的方式实现3D数据收集。这种技术的局限在于,收集的3D数据不能太大。

然而在3D资料要求不断升级的今天,对于超大场景的3D数据感知,正在成为一个热门议题。比如无人驾驶中使用的城市高精地图,就可以看做一个个超大3D场景的拼接。智能城市领域运用到的很多城市数据推演,也要根植于对城市3D场景的收集。

机器视觉正在为超大场景的3D数据感知提供很多新的方法。比如自动化的成像方法,像视觉SLAM在线处理连续帧的图像,实现实时重建巨大3D场景。再比如说对航拍数据进行点云分割和点云数据的语义理解,帮助快速低成本获取城市3D数据。

总体来看,今天超大场景的3D数据感知,有三个主要应用方向,很可能分别成为各自技术领域中新的投资和创业热点:

1、建筑物的3D高精度模型,运用在工程监理、智能设计、物流和智能城市领域。

2、高精地图与3D数据感知的结合,这是无人驾驶的重要一环。

3、室内外一体的3D建模,这对于智能家居设计、环境监控、VR/AR体验来说都有重要帮助。

手机与3D视觉进入蜜月期

3D结构光,今天已经当之无愧成为了高端手机的标配,成为了继双摄、三摄与屏下指纹之后又一个手机行业争抢的热点。

然而手机上的3D视觉技术远不止于结构光,从算法、传感硬件,到影像系统解决方案,都可能成为手机与3D视觉进一步耦合的关键因素。

今天来看,有3个相关趋势非常可能成为明年的热点。一个是基于芯片端进行的3D视觉算法加速,这很可能成为手机AI的下一个进化方向。第二个是高纠错能力的3D视觉算法将会普及,在终端实现3D数据收集和本地建模将会成为新的热点。第三个是后置摄像头加入3D视觉解决方案指日可待。

从芯片端,到开发平台,再到数据集、传感系统,3D机器视觉正在多个领域影响手机战场的走向,在这些领域储备技术武器,也很可能成为明年手机战场厮杀的关键节点。

AR/VR中的位姿估计技术

为什么我们在玩AR体验的时候,经常会觉得手机里的东西放在摄像头视野中并不真实,像是漂浮在地板上一样。

这就是因为位姿估计算法不够精准,无法正确定位物体的空间关系。在机器视觉技术的进化下,今天很多位姿估计技术正在同步进化。比如基于动态特征提取算法,达成的动作定位今天已经比较成熟。

这东西听起来挺玄乎,到底是干啥用的呢?它的最大应用场景,就是在VR/AR正确处理场景中动态物体的空间关系和运动轨迹。比如你在VR里玩踢球游戏,球应该在什么位置挨踢,以什么轨迹撞墙,都有赖于位姿估计算法来校准。

在机器视觉算法的帮助下,更精细的位姿估计正在到来,而这也加速了成熟MR体验的到来。另一方面,在VR设备或者手机当中,基于摄像头与传感器协同运作来完成位姿估计,也是沉浸技术中即将发生的一个亮点。

通过散乱数据达成三维建模

3D机器视觉的最重要任何,肯定是基于数据来实现3D建模。这个应用在产业端十分重要,地理信息系统、勘探、工程,以及无人驾驶,都需要大量的3D建模工作来参与。

而消费者级的3D建模今天也在到来,我们已经可以看到在手机端通过3D结构光来完成数据收集,从而达成3D建模的玩法。

跟3D感知一样,3D建模也是利用摄像头或者传感器来收集数据,最终通过不同的解决方案完成建模。

然而这个领域还是有很多问题等待解决。比如说,今天我们进行3D建模时,还需要非常痛苦的一点点收集数据,必须保证数据的对齐和精准排列。否则出来的3D模型就是杂乱无章的。这显然让大众完3D建模的热情减退,并且给很多工程级项目增添了非常多难度。

AI的到来,正在帮助这种情况有所改变。在深度学习算法的帮助下,机器视觉领域正在研究如何在散乱、不规则、巨大数量的数据中完成3D建模。这需要对抗生成以及先验表示等非常多的方案,但带来的效果非常值得期待。

比如说今天已经有3D建模方案,在深度学习的帮助下实现对密林的重建。然而其用来进行点云建模的图像数据中,有很多被树叶遮挡的部分。这时候就可以用AI来增强3D建模的先验知识,主动“脑补”出遮挡物背后的真实样子。

不仅是修复遮挡模型和瑕疵数据,机器视觉技术与3D建模的融合,还可以让很多无人设备具有更雪亮的“眼睛”。比如无人驾驶汽车,或许可以基于“大脑”中的3D建模算法,来脑补智能摄像头尚未发现的环境。这点在复杂立交桥和停车场中格外有用。

在消费者端,3D建模与机器视觉的结合也将带来新的想象力,比如消费者可以根据照片来重建精准的3D模型,或者傻瓜式完成建模要用的数据收集。让不那么专业的人也能建设出专业的3D模型,这个改变背后的想象力惊人。

更好的深度传感器解决方案

还有一个机器视觉技术和3D的交汇,主要发生在无人机领域。

无人机今天进行测绘和航拍时,必须附带对空间的理解能力,否则拍照不准事小,撞了南墙事大。而这个能力主要来自于摄像头和传感器进行空间阅读。

随着消费级无人机的不断升级,人们对无人机拍摄效果要求也不断升高。无人机必须不断在更远的距离、更极端的天气、更复杂的运动中拍摄画面。然而传统的传感系统解决方案已经快要跟不上用户的期许。

今天的消费级无人机,一般采取两种感知解决方案,一种是双目视觉技术,比如大疆的某些产品;一种是结构光传感器,比如微软的Kinect。而这两种主流方案都是有一定局限的,比如感知范围都有限,难以完成远距离作业。再比如双目视觉技术在黑夜中会失灵,所以无人机夜拍一直是个大坑,然而结构光技术应对不来强光,一到中午无人机就石乐志也是很心塞的。

更好的解决方案,在于将传感器与智能摄像头结合起来,达成可以适应不同天候与天气,并且可以长距离感知的新型传感系统解决方案。

今天,用机器视觉技术中的很多算法,协调不同的传感设备工作,让无人机变成“多眼无人机”,正在成为流行的解决方案。机器视觉算法大量加入无人机传感器,还可能带来轨迹拍摄能力提升,让无人机获得拍摄整体环境,或者精准捕捉动态物体,比如说运动中的动物和车辆的能力。

以上几个技术趋势,都可能成为机器视觉和图形学应用的下一步热点。这个领域看似偏门,事实上却能影响今天科技市场中的风吹草动。

让机器看到立体世界的游戏才刚刚开始,机器与人类在某一天可以用同样的视角相互凝视,或许才是这个故事的终点。

推荐阅读

史海拾趣

Concord Semiconductor Corp公司的发展小趣事

Concord Semiconductor Corp深知人才是企业发展的根本。因此,公司高度重视人才培养和引进工作。公司建立了一套完善的人才培养机制,通过内部培训、外部引进等方式,不断提升员工的技能水平和综合素质。同时,公司还积极营造良好的工作氛围和企业文化,吸引更多优秀人才加入。这些人才的加入为公司的持续发展提供了有力保障。

ETL [E-Tech Electronics LTD]公司的发展小趣事

ETL始终将品质管理和客户服务放在首位。公司建立了完善的质量管理体系,从原材料采购到生产、检测、包装等各个环节都进行严格的质量控制。同时,ETL还注重提升客户服务水平,为客户提供全方位、个性化的服务。这些措施使得ETL的产品质量得到了客户的高度认可,也为公司赢得了良好的口碑。

Brand-Rex公司的发展小趣事

随着全球市场的不断扩大,Brand-Rex也将目光投向了潜力巨大的中国市场。作为首批进入中国市场的国际一线品牌之一,Brand-Rex凭借其卓越的技术和产品质量迅速赢得了中国客户的青睐。然而,由于公司重组和调整,Brand-Rex在2005年之后暂停了在中国大陆地区的销售。幸运的是,2009年8月,Brand-Rex与上海速越电子工程有限公司合作重返中国市场,进一步推动了其在华业务的发展。

Autonics公司的发展小趣事

Autonics自成立以来,一直致力于传感器和控制器的研究与开发。公司拥有一支高素质、专业化的研发团队,不断推出具有创新性和竞争力的产品。经过多年的努力,Autonics的产品种类逐渐丰富,性能不断提升,赢得了市场的广泛认可。同时,公司还注重与国内外高校、科研机构的合作,引进先进技术,提升自身的研发能力。

Connection One公司的发展小趣事

面对日益激烈的市场竞争,Connection One公司不断推陈出新,研发出一系列创新产品。这些产品不仅性能卓越,而且设计新颖,深受消费者喜爱。公司因此赢得了大量忠实客户,业绩持续攀升。

创都(CAX)公司的发展小趣事

在电子行业的浪潮中,创都(CAX)公司凭借其卓越的技术创新能力,逐渐崭露头角。公司创始人李先生是一位热衷于新技术的电子工程师,他带领着一支由业内顶尖人才组成的研发团队,不断挑战技术极限。在一次偶然的机会中,他们成功研发出了一款具有革命性意义的高效能芯片,这款芯片不仅性能卓越,而且成本大幅降低,迅速在市场中获得了广泛认可。随着这款芯片的成功推出,创都公司的知名度迅速提升,订单量激增,公司也借此机会逐步扩大了生产规模和市场占有率。

问答坊 | AI 解惑

优秀PCB设计工程师所需要具备的本领

1.会熟练的使用cadence或mentor软件layout.         2.能独档一面,从做器件到布局布线出光绘。     3.有做各种pcb的设计经验, 如电脑主板,手机,数码相机等电子消费产品,GSM和3G产品的基站单元板,背板, ...…

查看全部问答>

[FPGA]Verilog三段式状态机描述

时序电路的状态是一个状态变量集合,这些状态变量在任意时刻的值都包含了为确定电路的未来行为而必需考虑的所有历史信息。 状态机采用VerilogHDL语言编码,建议分为三个always段完成。 三段式建模描述FSM的状态机输出时,只需指定case敏感表为次 ...…

查看全部问答>

请教WINCE下USB AUDIO设备驱动问题

在WINCE6.0上做一个基于PCM2704芯片的USB AUDIO设备驱动。这是一个USB混合设备,有Audio Class 和HID Class两种接口。此设备有三个Interface,分别是Audio Control,Audio Stream,HID Interface。三个EndPoint,分别是Default EP0,Audio Stream Int ...…

查看全部问答>

IAR环境下,如果要往RF-CC2430下载协议栈,要怎样设置?

总是下载不成功,不知道option里的参数该怎样设置?求大牛指教,不胜感激!…

查看全部问答>

知名外资通讯企业招聘软件开发工程师,协议工程师,算法分析和实现工程师及算法分析系统仿真工程师!!!

无线产品软件开发工程师 职责描述: 负责无线产品软件模块的设计、编码、调试、单元测试等工作,参与相关质量活动,确保设计及实现工作按时保质完成。 职位要求: 1. 本科以上学历,计算机软件、通信、电子、数学、物理及相关专业,有扎实的 ...…

查看全部问答>

急求一个可用的DXP2004

小弟在网上下了好多DXP2004都有些问题,这两天搞得焦头烂额的,希望那位有的能传给我,不胜感激! wanglei198661@163.com  有sp3的最好,sp2的也行 可以用的话给100分!!!…

查看全部问答>

WCE基本问题!急!!!!!

我最近期购买了一套ARM开发板子,后来发现我的笔记本上没有串口,请问下用USB转串口线能现实学习板的下载,调试等功能吗,急!…

查看全部问答>

用什么代码能开启pda的无线功能?

用什么代码能开启pda的无线功能? wince高手们,小弟现在用的是华硕的626的一款pda,操作系统是windows   mobile6.0,支持无线Wi-Fi; 小弟现有一个问题,我在程序中用什么函数能够自动启用无线功能?…

查看全部问答>

关于单片机控制GSM模块的问题

刚刚接触GSM模块,在写程序。对于GSM模块的功能不太了解。 1、收到手机短信了,模块读取短信的过程,是收到新短信之后给单片机一个信号,然后单片机发一个读的AT指令进行读取吗? 2、单片机第一次向模块指令,直接发“AT+XXXX”就可以了吗? 3、 ...…

查看全部问答>

TI 芯片TPS92310非隔离拓扑--LED驱动电路图

TPS92310:TI大功率LED驱动器,下图是一个LED非隔离拓扑电路图 德州仪器 (TI) 宣布针对其非调光 LED 驱动器产品系列推出一款最新离线式初级侧感应控制器。最新支持功率因数校正 (PFC) 的 TPS92310 AC/DC 恒流驱动器TPS92310 是支持 PFC 的初级侧稳 ...…

查看全部问答>