历史上的今天
返回首页

历史上的今天

今天是:2025年04月12日(星期六)

2019年04月12日 | 自动驾驶技术存在哪些令人头痛的问题?

2019-04-12 来源:eefocus

即将在6月举行的CVPR 2019,是机器视觉方向最重要的学术会议。评选结果已经宣布,今年论文量增加了56%,与无人驾驶相关的论文和项目也是扎堆亮相。其中的一大亮点,就是以自动驾驶视觉为核心的CVPR WAD 挑战赛。

 

今年的挑战赛中,伯克利和滴滴将分别开放了自家的超大规模驾驶视频数据集BDD100K和D²-City,BDD100K包含10万个美国公开驾驶视频,D²-City提供中国几大城市的超过10000个视频记录。这些数据集都被标注了好了所有道路物体,以及天气、道路和交通条件等关键对象和数据,以此催生能够改变无人驾驶安全隐忧的算法。

 

 

按照伯克利的规划,这次挑战将集中在目标检测与目标跟踪任务的域适应上,并能够在中美的不同城市场景中实现自动迁移。

 

那么,域适应对自动驾驶的安全问题究竟有多重要?我们通过一篇文章来抢先了解一下。

 

论自动驾驶的倒掉与重生

在解释“域适应”之前,有必要先搞清楚,现在的自动驾驶技术都在头痛哪些问题。

 

尽管无人驾驶测试车的上路里程和接管数据都越来越漂亮,但对于机器学习模型来说,如何在新的、未知的环境中也能和测试道路上表现的一样优秀,这仍然是一个公开的难题。

 

举个例子,自动驾驶汽车可以利用在硅谷的道路测试数据集训练出一个表现良好的无人车模型。然而,同样的模型如果被部署在波士顿这样多雪天气的地区,就可能表现得很糟糕,因为机器以前从来没有见过雪。如何在差异化的环境中进行有效的自主操作,复用自己学到的经验,这仍然是机器学习的一个难点。

 

 

如果说波士顿和硅谷,由于气候和路况上的巨大差异,在一年的任何时候,都可以被系统标记为不同的域,可以通过不同的模型来解决。那么面对高度相似域,比如同样是城市街景,但北京和重庆却有着不同的道路设计,难度于是再一次升级了。

 

以往的解决方案是“吃一堑,长一智”。收集训练集(包括失败范例)的数据,提取特征,然后让机器依据经验误差最小准则学习分类器。但这样容易产生三个问题:

 

一是域之间的迁移效果不稳定。如果训练集和测试集分布一致,则模型的迁移效果较好。如果分布不一致,在源域过拟合,目标域上则表现并不让人满意。

 

二是有限的变化性。通过标注好的训练数据集所学会的策略,往往只能应对特定的环境和物理系统。而真实的世界常常会遇到动态变化,比如异常光线、特殊气候现象等等,这些都会改变域属性并让无人车不知所措。

 

 

三是社会舆论的高风险性。要让无人车系统从失败中吸取经验,首先,它要先犯错。但这在目前普通居民对无人车安全非常担忧的大环境下,无人车碰撞、剐蹭、识别太慢等问题都会被拿出来质疑,再采用依靠事故数据来学习如何避免错误的方法无疑是灾难性的。

 

显然,我们需要借助其他方法来调教无人车,来减少它在陌生环境中失败的次数。“域自适应”就是其中之一。

 

那么,到底什么是域自适应学习?

先解释两个关键概念:

 

一是源域(source domain)表示与测试样本不同的领域,但是有丰富的标注数据。比如伯克利和滴滴的驾驶视频数据集BDD100K,以及D²-City。

 

一个是目标域(target domain)表示测试样本所在的领域,无标签或者只有少量标签。当一辆无人车测试车从硅谷变换到波士顿的道路上,它面对的就是一个全新的目标域。

 

如何尽可能地复用它在源域数据集中得到的先验知识,尽可能准确地对目标域物体实现检测、跟踪等学习任务,就成为无人车模型要面临的一大问题。

 

 

 

我们再将任务分门别类梳理一下:

1.域适应的可能性。简单来说,就是满足哪些条件才有可能实现域自适应学习。这对模型的学习能力(算法也有学霸和学渣之分)、源域和目标域的相关性(比如硅谷和重庆的路面差异)、算法的误差界分析(源域和目标域必须同时满足最小近似误差)、学习任务的先验知识等,这四个问题的妥善解决,才能有效帮助机器进行域自适应学习。

 

2.鲁棒性。在域自适应学习中,训练样本和测试样本之间的分布不一致,因此导致源域上训练的模型往往不适用于目标域的学习。而域自适应学习的鲁棒性则能够度量算法对训练样本改变的敏感程度,从而克服目标域泛化误差界的“扰动”。简单来说域自适应学习模型就是一枚“暖男”,对误差的包容性更强。

 

3.统计估计的一致性。在确保模型可以对目标域进行学习之后,就需要解决域适应学习有效性的问题了。

 

这往往依赖于有效的源域和目标域的概率分布判断也就是最考验机器智商的一致性分析。使用尽可能少的样本数,实现最小的误差上界。好的域自适应性学习算法是不允许“偏科”的,泛化能力得非常强才行。 

 

 

说了这么多,不难看出域自适应性学习本质上和人类的学习模式极为相似:在课堂上学习前人总结好的科学知识,然后在与现实的交流过程中不断扩充新的知识并进行探索,完成对复杂事物的认知,从而达到自主学习、适应新科目的目的。

 

无人车的域自适应性学习也是同样的逻辑:先利用已有的标注数据进行初始化学习,然后在大量未标注的数据中不断依据先验知识进行样本挖掘,以增量地学习模型和适配未标注数据,从而在陌生的道路环境中也能表现良好地完成学习任务。

 

目前看来,域自适应性学习也是完成无人驾驶视觉任务成本效益较高的方式。

 

新的算法还在路上

既然“域适应”对于无人驾驶来说如此重要,那么目前究竟有哪些比较值得一览的算法呢?

 

目前看来,由于无人驾驶任务自身的复杂性,往往需要 从多数据源向目标域进行迁移学习,这就必须考虑两个难题:

 

一是多种源域数据本身之间具有偏差,比如伯克利的数据集BDD100K覆盖了不同的时间、光照、天气和地理位置,甚至包含了GPS和IMU以及对应的时间戳信息;

 

二是多种源域数据间类别存在偏差。比如滴滴D²-City数据集中,将注释了包围框和跟踪ID的道路对象分为12个不同的类别,而伯克利的数据集BDD100K中的GT框标签则只有10个类别。

 

这些都对算法性能提出了不少挑战。在此,我们不妨列举几个具有代表性的算法,看看他们是如何解决无人驾驶相关技术难题的:

 

1.自适应曝光算法。前面提到,不同城市和路面环境的光线强弱都是不同的,为保证无人驾驶车辆在各种光线环境都能够获取可靠的道路信息,有研究人员提出了一种自适应曝光算法。利用光学传感器将采集图像转化为灰度值,并逐行进行动态阈值比对处理,快速获取下一周期正确曝光点。在道路实际的测试中,该算法能够快速并有效获取道路信息,后续的边界处理较为清晰。

 

 

2.路面障碍物检测。原理是利用已有的先验知识,比如从源域图像中学会辨识障碍物的颜色、边缘、纹理特征等等,对目标域道路上的不同车辆进行分析并快速提取出障碍物。

 

这方面的算法很多,比如Zielke等人利用马路边缘的对称性与显著性来提取马路边缘信息。Kuehnle等人基于图像中车轮的对称性来识别车的后轮。Crisman等人利用视觉图像中的颜色信息实现了马路跟随等等,都从不同程度提升了无人驾驶目标检测的性能。

 

3.多源域数据迁移算法。商汤的研究人员提出了一种名为“鸡尾酒”的网络,以解决将知识从多源域的数据向目标域迁移的问题,来帮助无人车模型更有效地识别新环境。

 

 

具体的做法是,利用共享特征网络,对所有源域以及目标域进行特征建模,然后利用多路对抗域适应技术(类似于GAN生成器),每个源域分别与目标域进行两两组合对抗,以此明确学习域的不变特征,极大程度地降低系统因数据偏差而对环境进行误判。

 

归根结底,“域自适应”方法不仅降低了训练风险,也有效地提升了系统的学习性能。从这个角度想,就更期待在CVPR 2019挑战赛中见到新的黑马了!

 

多说一点:

现在看到“无人驾驶”这四个字,绝大多数人会想到什么?圈内人可能会觉得“凉”,而普通民众则是“反感”。

 

2019第一季度刚刚过去,关于无人驾驶的负面新闻层出不穷:

 

去年创下融资纪录的RoadStar.ai星行科技死于内讧,成为第一家倒下的无人车公司;苹果自动驾驶部门裁员190人,无人车数量减少到62辆;有吴恩达背景的美国自动驾驶创业公司Drive.ai上个月也传出了“卖身”的消息。

 

产业之所以受挫,实在是因为无人车的安全性难以完全说服民众。

 

就在前两天,有研究人员通过在路上贴贴纸之类的“物理攻击”就让特斯拉的自动驾驶汽车并入了反向车道,甚至还能在没有车主授权的状态下用Xbox 游戏手柄操控。

 

即便是在无人车最为成熟的湾区,也有不少当地居民扎胎的扎胎,拿枪的拿枪,让人对无人驾驶的未来有点灰心。

 

 

而当前景变得不再明朗的时候,或许,追求技术才是最终的续命之道。

 

以往在计算机视觉、机器学习等领域的顶级会议中,关于域适应的研究都集中在图像分类和语义分割方面,很少看到实例级任务上的应用,如目标检测及跟踪,尽管它们对于无人驾驶来说更加重要。

 

当然,想要让“域适应”帮助无人车更有效的训练,只靠伯克利和滴滴在CVPR 2019中释放的数据集或某一场比赛还远远不够,还要为研究者提供更多元的支持,比如增强研究团队与车企的联系,围绕真实需求进行配套研发等等。

 

在此之前,这项复杂的技术还是老老实实地待在实验室和测试道路上吧。


推荐阅读

史海拾趣

Advanced Semiconductor, Inc.公司的发展小趣事

为了进一步扩大市场份额,ASI积极寻求与全球各大电子企业的合作。通过与这些企业的战略合作,ASI不仅获得了更多的订单和市场份额,还进一步提升了自身的技术水平和创新能力。同时,ASI也积极参与国际半导体行业的交流和合作,与全球同行共同推动半导体技术的发展。

DURABLE公司的发展小趣事

DURABLE公司成立于20世纪90年代初,最初是一家专注于电子材料研发的小型科技公司。在创始人李博士的带领下,DURABLE不断投入研发资金,积极探索新材料在电子行业的应用。经过数年的努力,公司成功开发出一种具有超高耐用性和稳定性的新型电子材料,这一创新为DURABLE赢得了业界的广泛认可。随着技术的不断成熟,DURABLE的产品逐渐应用于智能手机、平板电脑等高端电子产品中,公司的市场份额也逐年攀升。

Densei-Lambda (TDK)公司的发展小趣事

随着环保意识的日益增强,DURABLE公司积极响应全球绿色发展的号召,将环保理念融入产品研发和生产过程中。公司投入大量资金用于研发环保型电子材料,并成功推出了一系列具有环保性能的产品。这些产品不仅满足了市场对环保产品的需求,还为公司赢得了良好的社会声誉。同时,DURABLE还积极推广绿色生产和循环经济理念,为电子行业的可持续发展做出了积极贡献。

Chiefdom Electronic Co Ltd公司的发展小趣事

随着全球化的深入发展,Chiefdom Electronic Co Ltd意识到国际化布局对于提升竞争力的重要性。公司开始积极拓展海外市场,设立海外研发中心和销售网络,以便更好地了解当地市场需求和文化特点。通过本地化运营和定制化服务,公司成功打入多个国际市场,并获得了良好的业绩回报。这些国际化布局不仅提升了公司的整体竞争力,还为其在全球电子行业中占据了更加重要的地位。

ABOV(现代单片机)公司的发展小趣事

在电子行业的激烈竞争中,Chiefdom Electronic Co Ltd凭借一项革命性的芯片技术,成功打破了市场的僵局。公司投入巨资研发,历经数年努力,终于推出了具有高效能、低功耗特点的芯片产品。这一技术的推出,不仅为公司在智能手机、平板电脑等市场赢得了大量客户,还使得公司在全球芯片市场占据了重要地位。随着技术的不断优化和升级,Chiefdom Electronic Co Ltd逐渐成为了行业内的技术领军者。

Advanced Components Industries Inc公司的发展小趣事

Advanced Components Industries Inc(以下简称ACI)在电子行业的崛起,始于一次关键的技术突破。公司研发团队成功开发出一种新型的高效能电子元件,这一创新不仅提高了电子设备的性能,还降低了能耗。这一成果迅速吸引了市场的关注,ACI的订单量激增,公司开始迅速扩张。

随着技术的不断完善和市场的认可,ACI逐渐在电子元件领域建立了自己的品牌地位。公司不断投入研发,推出了一系列具有竞争力的产品,逐渐在行业中崭露头角。

问答坊 | AI 解惑

单片机实现水中油浓度检测

用单片机实现水中油浓度在线实时检测…

查看全部问答>

FX-20P-E手持编程器操作手册

三菱手持式编程器使用手册,以前我学习编程序时候就是用它,虽然不如电脑直观,但是也锻炼了对指令的记忆了,呵呵呵,希望对大家能有用。…

查看全部问答>

用ARM写程序,串口发送等程序要自己编吗?

如果用ARM的开发板,向超级终端发送文字,我知道有很多现成的头文件,里面有串口发送的函数,那有没有必要自己再编写一个呢?如果换作是其他的现有的函数呢? 现在学ARM9,用的是2440.因为是刚接触ARM,很多都不了解,请高人指点一下!!!!…

查看全部问答>

我的2407无法仿真,观察到如下现象,网帮忙检查原因

用usb20emurst程序可以扫描到芯片?? 你只能判断是否连上了,仿真器,不能说你能扫描到芯片,…

查看全部问答>

ARM、DSP、FPGA的特点和区别

  ARM(Advanced RISC Machines)是微处理器行业的一家知名企业,设计了大量高性能、廉价、耗能低的RISC处理器、相关技术及软 件。ARM架构是面向低预算市场设计的第一款RISC微处理器,基本是32位单片机的行业标准,它提供一系列内核、体系扩展、微 ...…

查看全部问答>

LM3S的eth接口是不是很容易坏?

目前产品中已经有好几个芯片有类似情况,就是上电后,eth不能连接,换个cpu后就好了,不知道是什么情况。电路如下图所示:请有经验的大虾帮忙分析分析!CPU型号是LM3S9B92-C5 [ 本帖最后由 zxq6 于 2012-4-18 12:28 编辑 ]…

查看全部问答>

初学msp430,怎么开始啊???

以前学过51单片机,但是没有认真学,现在开始接触msp430,感觉无从下手,望高手指点指点,让我开始入门,谢谢…

查看全部问答>

《玩转TI MSP430 Launchpad》与大家见面了!

    TI-EEWORLD联手打造的《玩转TI MSP430 Launchpad》与广大工程师朋友们见面了!按照传统的观念,单片机入门教材或工具书之类都应是由资深专业人士编写,而与此不同的是,本书中大量精彩内容来自于网友们的经验和知识,这些都是来自于 ...…

查看全部问答>

IAR 430编译出现这个警告是什么意思,怎么消除啊

IAR 430编译出现这个警告是什么意思,怎么消除啊 Warning[Pa050]: non-native end of line sequence detected (this diagnostic is only issued once) F:\\Mixed Files\\msp430 files\\msp430g2452\\mcp2515_test\\main.c 2…

查看全部问答>

TI 电源芯片和电源拓扑结构对应选择

TI 电源芯片和电源拓扑结构对应这个资料不错,推荐给大家,,, [ 本帖最后由 qwqwqw2088 于 2013-10-27 22:08 编辑 ]…

查看全部问答>