历史上的今天
返回首页

历史上的今天

今天是:2025年01月18日(星期六)

正在发生

2019年01月18日 | 自动驾驶领头羊Waymo十周年奉献:Auto ML机器学习

2019-01-18 来源:eepw

美国当地时间1月16日,全球自动驾驶领头羊Waymo,发布了十年周年庆祝短视频,并且在官方博客上发布了关于“Auto ML(Auto Machine Learning)”的文章,深度剖析了Auto ML与Google AI大脑,是如何帮助Waymo发展自动驾驶技术的。

Waymo的官方推特上写着:十年前的这个星期,“项目司机”正式成立,其使命是改善道路安全,使交通更加便利。从这个“登月”项目,到谷歌自动驾驶汽车项目,现在是Waymo,一起为下一个十年及更远的将来而努力!

  下面是关于Auto ML的文章,在Waymo,机器学习几乎在自动驾驶系统的每个部分都扮演着关键角色。它帮助我们的汽车看清周围的环境,理解世界,预测他人的行为,并决定他们下一步的最佳行动。

  以感知为例,Waymo的系统采用了神经网络的组合,使Waymo的车辆能够解读传感器数据、识别物体,并随着时间的推移跟踪它们,从而对周围的世界有一个深入的了解。

  创建这些神经网络通常是一项耗时的任务:优化神经网络架构,以达到自动驾驶汽车运行所需的质量和速度,是一个复杂的微调过程,Waymo工程师可能需要数月时间来完成一项新任务。

  现在,通过与来自Google AI大脑的研究人员合作,Waymo正在将前沿研究付诸实践,以自动生成神经网络。更重要的是,这些最先进的神经网络比那些由工程师手工调整的神经网络质量更高、速度更快。

  为了将Waymo的自动驾驶技术应用到不同的城市和环境中,需要针对不同的场景快速优化Waymo的模型。Auto ML使Waymo能够做到这一点,高效和连续地提供大量ML解决方案。

  

  01 迁移学习:使用现有的自动化架构

  Waymo和Google AI大脑的合作始于一个简单的问题:Auto ML能否为汽车生成高质量、低延迟的神经网络?

  质量衡量的标准是由神经网络产生的答案的准确性,延迟度量网络提供答案的速度,也称为推理时间。由于驾驶是一种活动,它要求车辆使用实时答案,并且考虑到系统的安全性,神经网络需要在低延迟的情况下运行。大多数网络直接运行在Waymo的车辆上,结果少于10毫秒,这比部署在数千台服务器上的数据中心中的许多网络要快。

  在原来的Auto ML论文(Learning Transferable Architectures for Scalable ImageRecognition PDF,获取方式见文末),谷歌AI的员工能够自动探索12000多个架构解决CIFAR-10的经典图像识别任务:确定一个小形象代表十个类别之一,比如买一辆汽车、飞机、一只狗,等等。

  在后续文章(NEURAL ARCHITECTURE SEARCH WITHREINFORCEMENT LEARNING

  PDF,获取方式见文末),他们发现了一个家庭的神经网络的构建块,称为NAS单元,这可能是由自动构建比手工网CIFAR-10和类似的任务。通过这种合作,Waymo的研究人员决定使用这些单元来自动构建针对自动驾驶任务的新模型,从而将CIFAR-10上的知识转移到汽车领域,第一个实验是语义分割任务:识别激光雷达点云中的每个点,如汽车、行人、树等。

  

  图一:一个NAS单元的例子,这个单元在神经网络中处理前两层的输入

  为此,Waymo研究人员建立了一个自动搜索算法,在卷积网络架构(CNN)中探索数百种不同的NAS单元组合,为Waymo的激光雷达分割任务训练和评估模型。当Waymo的工程师手工调整这些网络时,只能探索有限数量的架构,但是使用这种方法,可以自动探索了数百个架构。

  相比以前的人工微调优化神经网络,Auto ML通过下面两种方式来改进:

  一些具有类似质量的延迟显著降低;

  其他的则具有更高的质量和类似的延迟。

  初步成功后,Waymo将相同的搜索算法应用于另外两个与交通车道检测和定位相关的任务,转移学习技术也适用于这些任务,最后能够在汽车上部署三个新训练和改进的神经网络。

  

  十年前的Waymo自动驾驶汽车(普锐斯)

  02 端到端搜索:从头开始搜索新的架构

  被最初成功的结果所鼓舞,接着就是更进一步、更广泛地寻找能够提供更好结果的全新架构,通过不局限于组合已经发现的NAS单元,可以更直接地寻找考虑到严格的延迟需求的架构。

  执行端到端搜索通常需要手动探索数千个架构,这需要大量的计算成本。探索单一架构需要在具有多个GPU卡的数据中心计算机上进行几天的培训,这意味着搜索单个任务需要数千天的计算时间。相反,通过设计了一个代理任务:一个缩小的激光雷达分割任务,可以在几个小时内解决。

  Waymo团队必须克服的一个挑战,是找到一个与最初的细分任务足够相似的代理任务。在确定代理任务上的架构质量与原始任务上的架构质量之间的良好相关性之前,对几个代理任务设计进行了试验。然后,启动了一个类似于AutoML论文的搜索,但现在是代理任务:一个端到端代理搜索。这是这个概念第一次应用在激光雷达数据上。

  

  图二:代理端到端搜索:在一个缩小的代理任务上探索数千个架构,将100个最佳架构应用于原始任务,验证和部署car上最好架构中的最好架构

  Waymo使用了几种搜索算法,对质量和延迟进行优化,因为这对车辆非常重要。观察不同类型的CNN架构,使用不同的搜索策略,如随机搜索和强化学习,能够为代理任务探索超过10,000种不同的架构。通过使用代理任务,在谷歌TPU集群上需要一年以上计算时间的任务只需要两周时间。

  当我们刚刚转移了NAS单元,结果发现了比以前更好的网络:

  在相同的质量下,神经网络的延迟降低20-30%;

  具有更高质量的神经网络,错误率降低8-10%,与以前的架构具有相同的延迟。

  

  图三 :1)第一个图展示了在一组简单的架构上随机搜索发现的大约4000个架构。每个点都是一个经过培训和评估的架构。实线表示不同推理时间约束下的最佳体系结构,红点表示用转移学习构建的网络的延迟和性能。在这种随机搜索中,网络学习效果不如迁移学习

  

  图三:2)在第二张图中,黄色和蓝色的点表示另外两种搜索算法的结果。黄色的是对一组精致架构的随机搜索。蓝色的那个使用了强化学习,就像在[1]中一样,探索了6000多个架构。它产生了最好的结果。这两个额外的搜索发现,网络明显优于迁移学习的网络

  在搜索中发现的一些架构显示了卷积、池化和反卷积操作的创造性组合,如下图所示。这些架构最终非常适合最初的激光雷达分割任务,并将部署在Waymo的自动驾驶汽车上。

  

  图四:由代理端到端搜索发现的一种神经网络结构

  03 接下来是什么

  Waymo的Auto ML实验仅仅是个开始。对于激光雷达分割任务,传输学习和代理端到端搜索都提供了比人工制作更好的网络,现在有机会将这些机制应用到新的任务类型上,这可以改善许多其他的神经网络。

  这一发展为未来的ML工作开辟了新的令人兴奋的道路,并将提高Waymo的自动驾驶技术的性能和能力,并继续与谷歌AI大脑的合作。


推荐阅读

史海拾趣

华瓷(Chinocera)公司的发展小趣事

人才是企业发展的根本动力。华瓷深知这一点,因此在人才战略和团队建设上投入了大量精力。公司注重员工的培训和发展,为员工提供广阔的发展空间和良好的职业前景。同时,华瓷还积极引进国内外优秀人才,打造了一支高素质、专业化的团队。这支团队为公司的发展提供了有力的支持和保障。

台湾凌通(Generalplus)公司的发展小趣事
检查控制电路中的其他元件(如继电器、晶体管等)是否工作正常,有无损坏或接触不良的情况。
Genesis Microchip公司的发展小趣事

随着战后的经济复苏和科技的快速发展,GI开始积极寻求业务多元化和国际化的发展道路。公司不仅继续深耕电子技术领域,还逐渐涉足通信、计算机等多个领域,推出了包括通信设备、计算机硬件在内的多款新产品。同时,GI也积极开拓海外市场,通过设立分支机构、与当地企业合作等方式,成功将产品销往全球多个国家和地区。这一阶段的成功,使GI成为了名副其实的跨国电子巨头。

远东福斯特公司的发展小趣事

进入21世纪后,电子行业面临着前所未有的变革和挑战。随着信息技术的飞速发展,云计算、大数据、人工智能等新兴技术不断涌现,对传统电子企业提出了更高的要求。GI积极响应行业变革的号召,不断加大在新技术研发方面的投入,努力推动产品升级和转型。同时,公司也积极拥抱互联网思维,加强与互联网企业的合作与融合,共同探索电子行业的新未来。这一阶段的努力,使GI在激烈的市场竞争中保持了领先地位,并继续为电子行业的发展贡献着力量。

需要注意的是,以上故事是基于行业常识和通用发展路径构建的,并非直接针对GI的官方历史。由于GI的具体发展历史和详细故事可能因资料限制而无法全面呈现,因此以上内容仅供参考。

ERA Transformers公司的发展小趣事

为了保持技术领先地位和市场竞争力,ERA Transformers公司非常重视创新与研发工作。公司每年都会投入大量资金用于新产品的研发和技术创新。在一次研发项目中,公司成功开发出了一种具有超高能效和极低损耗的新型变压器。这款产品的问世立即引起了市场的广泛关注,并成功获得了多项国内外专利。持续的创新与研发使得ERA Transformers公司在电子行业中始终保持着领先地位。

Accelink Technologies Co Ltd公司的发展小趣事

在国内市场取得一定成功后,ERA Transformers公司开始将目光投向国际市场。为了打开国际市场,公司积极参加国际电子展会和交流活动,与多家国际知名企业建立了联系。通过深入了解国际市场需求和标准,公司对产品进行了针对性的改进和优化。经过一段时间的努力,ERA Transformers公司的产品成功打入了国际市场,并获得了良好的销售业绩和口碑。

问答坊 | AI 解惑

共阴LED显示驱动IC MAX7219

本帖最后由 jameswangsynnex 于 2015-3-3 19:58 编辑 共阴LED显示驱动IC MAX7219 …

查看全部问答>

分享第二课 初步认识51芯片

分享第二课 初步认识51芯片…

查看全部问答>

现在还有带COM口的笔记本吗?

本信息来自合作QQ群:AVR单片机学习与交流群(17727270) 群管理员在坛子里的ID:铜河 要有COM口,有并口。有网口…

查看全部问答>

EP3C120F780 等效门数多少??

EP3C120F780是CYCLONE III 中比较大的FPGA,其相关介绍资料如下图: 780个管脚,FBGA封装,工业温度(-40 到100度),商业温度(0~85度) ES: 工程样品, LEAD-FREE 表示啥意思?   此外上面也没有介绍,其等效的逻辑门数量? 这而也 ...…

查看全部问答>

WINCE USB摄像头驱动成功,结果实时视频速度太慢

这是一个大喜又大悲的结果,前天搞定了6410下USB摄像头驱动,可以捕获320X240 YUV420格式图像,昨天修改成了实时视频流的程序,结果大失所望,S3C6410的USB HOST是USB1.1协议的,全速12Mbps,所以我想获取30FPS的图像很难呀,实际测试结果是160MS一 ...…

查看全部问答>

获取-5v电源

用7805获取+5v电源,当然用7905就可以获取-5v电源 我的想法是,我能不能用运放把+5v输出经过运放反相输出做-5电源输出,我估计这样的-5V电源不稳定,忘高手说说我的想法行吗? …

查看全部问答>

(悭钱十月)我的淘宝购物经

淘宝购物特点是,一次性的,退不了的,所以\"兵者国之大事,不可不察也\" 一句话,挑最近成交多的,而且货比三家,再有同卖家谈好,别发生不愉快.   我上淘宝买东西主要有以下几种方式: 一,急 我对急用的东东,不卖不行非买不可的,我货比三家后,找 ...…

查看全部问答>

阻塞赋值和非阻塞赋值,综合出来硬件上的区别??

据我的总结如下: begin-end语句的各句话是顺序执行的; fork-join语句各句话是并行执行的; 阻塞赋值“=”计算表达式和赋值一起进行; 非阻塞赋值“<=”先计算表达式,再在语句块中统一赋值; 但是,唉,说实话还是搞得不明不白的!!比如begin- ...…

查看全部问答>

异步SRAM控制代码的问题

// sram_test.vmodule sram_test(clk,reset,write,read,writeaddr,writedata,readaddr,readdata,                 sram_oe,sram_ce,sram_lb,sram_we,sram_addr,sram_data);input clk; ...…

查看全部问答>

STM32F103VC的FSMC同步模式怎么用啊

                                 请教版主主,有没有相关的应用笔记,我用异步模式可以读写,但用同步模式就会跳到硬件错误中断。…

查看全部问答>