历史上的今天
返回首页

历史上的今天

今天是:2025年03月21日(星期五)

正在发生

2019年03月21日 | 相比特斯拉的自动驾驶技术,Waymo在训练数据上处于明显劣势?

2019-03-21 来源:与非网

模仿学习可能成为自动驾驶的关键;

大规模的训练数据是进行模仿学习的关键;

特斯拉拥有大量的训练数据;

Waymo没有多少训练数据。

如果可以实现的话,自动驾驶将成为我们这个瑰丽的时代最大的商机之一。单在美国,所有汽车每年的驾驶里程就达到了3.22万亿英里。如果这些里程都是通过自动驾驶驶跑出来,而且自动驾驶服务供应商每英里可以得到10美分的利润,那么,自动驾驶服务提供商每年在美国市场就能获得3220亿美元的利润。正是基于这种逻辑,谷歌旗下的自动驾驶公司Waymo的估值高达2500亿美金。

对于我来说,近期关于自动驾驶的一个最为吸引人的消息就是Waymo正在其自动驾驶中使用模仿学习技术。模仿学习是机器学习技术中的一种,它的神经网络观察人类所做的事情,学习在某些环境状态下执行的动作。通过训练人类行为,神经网络学习到“如果你遇到这种环境状态,就模仿人类那样去执行动作吧”。比如,“如果你看到前面有一个停车标志,请停下车。”或者,“如果你看到一辆停止状态的汽车挡了你的路,就这样慢慢绕开它。”

Waymo的研究团队负责人Drago Anguelov最近在麻省理工学院发表了一次演讲,深入探讨了这个话题。

Waymo在可以收集大量数据时使用模仿学习。但是对于Anguelov来说,Waymo的数据集中并没有足够的训练样例来进行模仿学习。在数据不足的情况下,它必须依赖手工编码算法,而无法使用机器学习来替代。

根据推断,Waymo应该已经自动驾驶跑了大约1500万英里。假设每3000万英里出现一次需要人类接管自动驾驶系统的情况,自动驾驶系统可以借此模仿的人类行为,那么,按照Waymo现在的行驶里程,它可能还没有遇到过模仿学习的样例。即便是每100万英里有一次人类接管行为可供模仿,它也不过只有15个样例。我不知道对模仿学习来说,多少个样例才能训练出判断为“真”,但是对于那些进行图像分类的神经网络来说,一般经验是需要至少一千个样例才能识别出来一种图像(比如大白鲨)。显然,Waymo不可能遭遇过这么多次可供模仿学习的样例。

虽然Anguelov很愿意在人类的驾驶行为中进行模仿学习,但是它并没有足够的数据样例。那么,谁有这些数据呢?

特斯拉有这些数据。据估计,搭载了特斯拉最新一代自动驾驶硬件的汽车数量已经超过了40万辆,所有这些车每天的行驶里程超过1300万英里。如果汽车数量增长到100多万辆时,每月的行驶里程将达到10亿英里。显然,车辆越多,里程数也越多,可供模仿学习的人类行为样例也就越多。

The Information的记者Amir Efrati写道,特斯拉正在利用这些里程中出现的人类行为进行模仿学习,他引用了至少一位在特斯拉自动驾驶部门工作的未具名消息人士的说法:

“知情人士表示,特斯拉的汽车手机了大量的摄像头数据和来自其它各类传感器的数据,当特斯拉车主开车时,即使他们没有启用车辆的自动驾驶系统,自动驾驶研究团队也可以检查人类在各种驾驶场景中的行为并模仿它。特斯拉的工程师认为,将足够多的人类驾驶行为数据输入到神经网络中,神经网络便可以学习如何在大多数情况下进行正确转向、加速或者制动。一位团队成员表示,特斯拉车主的日常驾驶会产生足够多的数据,“你不需要其它任何东西”来教系统如何自动驾驶。”

特斯拉官方还没有证实这种说法,但是其首席执行官埃隆马斯克最近在ARK Invest的一次采访中发表了一些评论,可能就是针对模仿学习的表态,在采访中有一句话值得注意:

“我认为我们特斯拉有一个别人很难超越的优势,那就是我们拥有大量的人工干预驾驶行为数据。可以这样认为,车主自己正在训练自动驾驶系统如何驾驶汽车。驾驶中有大量的模糊和奇怪的场景,你肯定都想不到。。。”

还有其它的表态:

“每一次有人干预驾驶,即接管了自动驾驶系统之后,我们的自动驾驶系统便会保存这些信息并将其上传到我们的系统里。我们真的开始变得非常擅长训练系统,甚至不需要人为输入训练数据、标记人工标签了。基本上,当一个驾驶员驶过一个交叉路口时,他就会训练自动驾驶系统应该怎么做。”

当然你可以认为马斯克的表态含糊不清,有多种可能的解释。但是对于我来说,我认为模仿学习和马斯克所说的东西最为吻合。

要进行模仿学习,特斯拉不需要上传视频等任何原始传感器数据,它直接上传感知型神经网络对其所看到的场景和驾驶员行为的判断。特斯拉一位名叫greentheonly的黑客可视化地展现了在特斯拉上运行的神经网络所做出的这种感知判断:

首先,表示“驾驶场景”的可视化信息包括车辆周围的3D形式边界、表示车辆类型和距离的文本标签以及显示可行车道的“绿色地毯”。

要进行模仿学习,需要将人类驾驶员对方向盘和踏板的动作数据和可视化的“驾驶场景”信息进行配对。这些状态-动作配对不需要人类的注释,人类进行标记实在是过于昂贵而且缓慢的学习过程。他们只需要上传到特斯拉的服务器,然后就可以用来训练神经网络了。

除了Waymo对模仿学习技术的背书和特斯拉含混其词的表述,我们还有什么理由相信模仿学习可以训练神经网络来执行复杂的任务呢?对于我来说,成功实施了模仿学习的最典型案例是AlphaStar,这是由Alphabet的子公司DeepMind创建的一个神经网络。DeepMind使用模仿学习来训练AlphaStar玩一个有数百万人类玩家的星际争霸游戏。星际争霸是一款相当复杂的游戏,里面设计长远规划、高级战略部署和对军事单位的实施战术控制,这样一个烧脑的游戏对于AI来说是一个相当艰难的挑战。但是,AlphaStar仅使用了模仿学习技术,就通过在星际争霸这个游戏的排名证明了相当于人类玩家的实力,达到了DeepMind估计的性能指标。换句话说,AlphaStar使用模仿学习技术,在星际争霸中达到了中等人类技能水准。

和DeepMind使用模仿学习训练其神经网络玩星际争霸游戏一样,在自主驾驶的训练中,特斯拉利用其车辆自主驾驶系统上传的数百万驾驶场景-驾驶行为配对数据训练神经网络,就可以达到中等水平人类驾驶员的水准。驾驶行为当然很复杂,但是星际争霸游戏也很复杂。所以我不认为使用模仿学习达到的自主驾驶效果达不到AlphaStar玩星际争霸的程度。

要想使模仿学习奏效,一个非常重要的条件就是感知必须正确。如果特斯拉的感知神经网络出了错,系统将无法识别驾驶环境的真实状态,也就无法获得正确的驾驶场景-驾驶行为配对。举个例子,如果感知神经网络将红色交通信号灯错认成了绿色,它观察人类停在了这样一个信号灯前面,它就会得出一个汽车应该停在绿色交通灯处的错误结论。即使它学会了如何对一个环境进行正确反应,它也需要检测出这些环境。因此,如果它知道红灯停绿灯行,它还必须准确地识别出信号灯的颜色才能做出正确的响应。系统需要准确地感知环境以便学习要做什么动作,而且必须准确地感知环境才能应用学习成果做出这些动作。

特斯拉新的神经网络计算机可以解决环境感知问题,被称为Hardware 3。特斯拉人工智能主管Andrej Karpathy说,特斯拉已经“训练了效果很好的大型神经网络”,但是“由于计算性能的约束无法把它们部署到汽车中”。现在有了Hardware 3,特斯拉将能够运行规模更大、更为准确的感知神经网络。

对于Waymo这样无法获得大量行驶车辆数据的公司而言,很难在模拟学习上找到可以走下去的路来。由于没有足够的训练样例来完成整个驾驶任务的模仿学习,它不得不依赖手工编码算法。在计算机视觉应用中,手工编码算法这种方式早已被神经网络完全淘汰,机器翻译应用也是如此。对于像星际争霸这样复杂级别的游戏而言,手工编码的机器人不可能接近AlphaStar这样的神经网络的性能。在自主驾驶上,神经网络方法似乎也比手工编码算法更有前途。

想推进模仿学习,Waymo必须将其训练车队的数量扩大好几个数量级。一个可行的方法是,Waymo可以向汽车制造商出售高级驾驶辅助系统,并通过它来收集数据,就像特斯拉现在的做法一样。这就要求Waymo打造一个比自主驾驶的功能涵盖范围更小的精简型新产品。这个新系统必须在没有激光雷达的情况下能够使用,或者至少不需要那种通常用于自主驾驶汽车的高范围、高分辨率的激光雷达。因为这种激光雷达成本过高,不可能普及到消费级的车辆中。如果这种方式意味着Waymo可以获取到所有的驾驶数据的话,汽车制造商可能不大愿意这么做。所以,Waymo可能需要以某种方式和汽车制造商分享成果,也许它可以同意汽车制造商合作伙伴分享未来的自主驾驶服务的收入,或者允许合作伙伴购买它的大量股权。

对于福特和通用这样的巨头来说,他们倾向于垂直整合,不大可能建立这种合作关系。我可以花10亿美元小钱购买自己的“Waymo”,干嘛和谷歌的Waymo合作呢?从经济学原理上来说,可以购买自主驾驶初创公司,这会让Waymo处于艰难的谈判地位。而且,这些汽车制造商似乎并没有他们的汽车收集训练数据。

两相比较下来,特斯拉完全占了上风。出于这个原因,我认为特斯拉更有可能分走现在市场上分配给Waymo的1000多亿美元估值。也许完全自主驾驶永远不可能实现,那就不用说了。但是如果真的实现了,这个市场可能价值三万亿美金。据我所知,在这个赛道上,特斯拉比Waymo以及所有其他公司都处于更有利的位置上,特斯拉可以凭借在模仿学习上的优势分走很大很大一块蛋糕。

推荐阅读

史海拾趣

Cantherm公司的发展小趣事

随着环保意识的日益增强,Cantherm公司积极响应国家号召,将环保理念融入产品设计和生产过程中。公司研发出一系列环保型电子产品,采用可降解材料和节能技术,有效降低了产品对环境的影响。这一举措不仅提升了公司的社会形象,还为公司带来了更多的环保项目合作机会。

AW Industries Inc公司的发展小趣事

除了追求经济效益外,AW Industries Inc还注重履行社会责任。公司积极参与环保事业,通过采用环保材料、减少废弃物排放等方式降低生产对环境的影响。同时,公司还关注员工福利和社会公益事业,通过捐款、资助等方式回馈社会。这些举措不仅提升了公司的社会形象,也为公司的长期发展奠定了坚实的基础。


请注意,这些故事是基于电子行业的一般情况虚构的,并不代表任何真实事件或公司。如果您需要关于特定公司的真实发展故事,建议您查阅相关资料或访问公司官网以获取更准确的信息。

全志(Allwinner)公司的发展小趣事

近年来,全志科技积极寻求与其他行业的合作,共同推进技术的创新和应用。例如,全志与安克创新建立了战略合作伙伴关系,在AI技术在智能硬件领域的创新研究、落地应用和推广方面展开了深入合作。这种合作模式不仅提升了全志的科技实力和市场影响力,也为公司的未来发展注入了新的活力。

以上五个故事分别展示了全志科技在创始与崛起、技术突破与市场认可、抓住市场风口、产品线拓展与战略转型以及合作与共赢等方面的发展历程。这些故事共同构成了全志科技在电子行业中的成长轨迹,也展示了其在面对市场挑战和机遇时的应对策略和决心。

Austek Microsystems公司的发展小趣事

面对行业技术的快速迭代,Austek Microsystems始终保持敏锐的洞察力。公司不断投入研发资金,引进先进的生产设备和技术人才,进行技术升级和产品迭代。通过不断地优化产品性能、提升生产效率,Austek Microsystems逐渐在市场中树立起了技术领先的形象。

鸿展光电(GPO)公司的发展小趣事

在追求经济效益的同时,Austek Microsystems也积极履行社会责任。公司严格遵守环保法规,采用环保材料和生产工艺,减少对环境的影响。此外,Austek Microsystems还积极参与公益事业,为社区的发展和进步贡献自己的力量。

这五个故事展示了Austek Microsystems在电子行业中的发展历程和取得的成就。通过创新研发、建立合作伙伴关系、技术升级与产品迭代、市场拓展与品牌建设以及履行社会责任等方式,Austek Microsystems逐渐在市场中崭露头角,成为了电子行业中一颗璀璨的明星。

Holy Stone公司的发展小趣事

在追求业务发展的同时,Holy Stone始终注重品质提升和环境管理。公司陆续通过了ISO9001、ISO14001、QS9000、ISO/TS16949等国际认证,确保了产品的高品质和环保性。这些认证不仅提升了公司的品牌形象和市场竞争力,还为客户提供了更加可靠的产品和服务。此外,公司还积极履行社会责任,在环境治理、社会参与等方面做出了具体贡献。

问答坊 | AI 解惑

SAE各汽车协议和标准的简介

1905年初,美国汽车工程师学会(SAE)认识到必须标准化。那个年代的汽车制造商都是小公司,从供应商购买零部件,然后组装成整车。当遍及全国的独立经销商销售各种车辆时,车辆需要经常维修。如果不返回汽车或零部件的原制造厂,就很难找到合适的配件,因此, ...…

查看全部问答>

一些点阵LED资料

点阵LED引脚资料....需要的拿去吧…

查看全部问答>

windows mobile下如何开发数据库access?

windows mobile下如何开发数据库access? 开发环境为 vc2005 …

查看全部问答>

关于中断优先级问题

#include #define uchar unsigned char; sbit p1=P0^4;//蜂鸣器地址 uchar code table[]={ 0xc0,0xf9,0xa4,0xb0, 0x99,0x92,0x82,0xf8, 0x80,0x90,0x88,0x80, 0xc6,0xc0,0x86,0x8e }; uchar num,t; void delay(int z); void main() { ...…

查看全部问答>

YL2440开发板SD卡无法识别

优龙2440开发板不能识别SD卡,网上查了好多人的帖子还是没弄好 现在做了:(1)把3个与SD卡有关的DLL拷贝到BSP专门放设备dll的文件夹中,创建了CEC文件并加载到了BSP中,把platform.bib中的注释掉的3个dll取消注释。但是还是无法识别,请做过的大 ...…

查看全部问答>

如何编写wince上的下载程序

该下载程序用C++写,运行在ppc上,功能是现实从internet下载文件到ppc上,请问各位有资料提供吗?十二分火急(因本人对c++不熟悉),希望大家多多帮忙…

查看全部问答>

很有型的摇摆闹钟

这款好似不倒翁一样的摇摆闹钟,设计的精妙之处完全在它的那根天线棒上:通过点触天线尖端,您可以设置闹钟的时间;转动天线棒可以打开或关闭闹铃功能。除此之外,它的妙用还在于当闹铃响起时,如果您还想多睡一会,可以拨动天线棒,使闹钟像不倒翁 ...…

查看全部问答>

老师们帮忙分析一下实验现象【LM3S】

PE7、PE6都悬空:结果如下 PE7接地(电源地)、PE6悬空:结果如下 PE7接地(与手相连)、PE6悬空:结果见附件 怎么PE6和PE7还相互影响呢? [ 本帖最后由 喜鹊王子 于 2012-3-23 09:44 编辑 ]…

查看全部问答>

全波精密整流后加一个运放分析求解

如图: 问题如下: 1、全波精密整流后U5B的的输出脚不加电容0.47uF为馒头波,加了电容,波形变平,C1的作用是为滤波,请问这里是怎么算出来的? 2、U5B出来的信号接至U7,U7由2个1N4148和一个电容组成,这个运放是干什么用的? 请指 ...…

查看全部问答>

MSP430F149_ad为

void Init_AD() {     P6SEL = 0x08;                                     // Enable A/D channel input ...…

查看全部问答>