历史上的今天
返回首页

历史上的今天

今天是:2025年04月26日(星期六)

2018年04月26日 | 基于Apollo分布式可扩展平台的自动驾驶设计

2018-04-26 来源:Apollo开发者社区

长沙智能驾驶研究院产品研发总监 黄英君

Apollo集中运行感知、决策、控制模块,对资源、实时性、可靠性需求是不同的,对计算平台、操作系统、运行环境的要求也各不相同。黄英君将这些模块进行解耦,分布式集成运行在不同的计算平台和操作系统上,即在一个高可靠的双机备份低成本平台上运行决策与控制模块,在多个低成本高性能技术平台上运行感知模块,实现一个分布式可扩展的解决方案。

以前要搭建Apollo开发平台的初期投入不菲,至少需要几万元。根据他提供的低成本方案,只需5000元左右(最新的价格是教育机构299美元),就能搭建起Apollo的开发平台,大大降低了自动驾驶开发的门槛。(提示:目前还只是能够部署,让Apollo的所有模块跑起来,还无法做到很流畅的实时的跑,这里有待大家一起去努力完善)。

以下是分享的全部内容。

作为一名普通的开发者,我在接触Apollo几个月的时间里,一直把Apollo作为学习的平台和工具。

首先Apollo代码更新很快,但是最近一次大规模的更新是在3月25日左右,后面几天发现有十几个到二十几个文件在更新---建议大家每天早上上班之后先查看GitHub一下。

第一个值得关注的文件是perception_lowcost.sh,这个名字非常有意思,脚本内容如下:

1
run perception "$@"--flagfile=modules/perception/conf/perception_lowcost.conf

这个加载了一个配置文件,打开后发现:

1234567
#Camera node subnodes {     id: 3     name: "CameraProcessSubnode"     reserve: "device_id:camera;"     type: SUBNODE_IN  }

上面这个subnode是新增加的摄像机节点;原来的配置文件中的两个信号灯摄像机节点、激光雷达节点都没有出现:

12345678910111213141516171819
 #TrafficLight Preprocess node.subnodes {    id: 41    name: "TLPreprocessorSubnode"    type: SUBNODE_IN } #TrafficLight process node.subnodes {    id: 42    name: "TLProcSubnode"    type: SUBNODE_OUT } #64-Lidar Input nodes.subnodes {    id: 1    name: "LidarProcessSubnode"    reserve: "device_id:velodyne64;"    type: SUBNODE_IN }

关于这几个摄像机,我们可以在驱动目录里面查看更详细的信息:

2.0版本有两个摄像机。打开目录:pollo\modules\drivers\usb_cam\launch的start_leopard.launch文件,定义了三个摄像机。

123

前两个是用来针对交通信号灯的,第三个针对障碍物,推测这个摄像机就是用来检测障碍物的。

打开源码perception目录,有一个camera目录,这个目录变化最大,也是开放代码量最多的一个目录,增加了车道线功能。我们是不是就可以得出结论,第三个摄像机将是执行障碍物检测和车道线检测。

综上所述,最新版本的Apollo,特别强调低成本,具体的方式是在高速场景下弱化了弱化了激光雷达和两个信号灯检测摄像机,增加了一个摄像机,专门执行障碍物检测和车道线检测。这个变化跨度非常大,一个激光雷达的价格就是70多万(64线),可以说是非常大的一个跨越。

另外说一句题外话,Apollo这个代码写的特别好,写代码的是很资深的架构师,所以Apollo这套代码有非常浓重的谷歌风格,并使用了大量的谷歌系工具,看它的架构非常舒服的,可以作为一个经典的大型c++工程demo,来学习他的c++编程和大型项目的构建。为什么考虑对Apollo进行分布式扩展?

为什么考虑对Apollo进行分布式扩展?

为什么考虑对Apollo进行分布式扩展?因为去年9月份我安排一个实习生,他开始做了几天,就说目录挺多,但是总装不上。后来我发现坑越来越多,问题越来越多。

去年9月份我们订购了PX2,但却缺货。后来代理商把他们自己的一块给我们用了,左边是Apollo推荐的计算平台,是台湾一家公司的,这个工控机非常小巧和紧凑,它的散热做得非常好,但是价格还是有点贵,而且订货周期比较长,还有就是PX2价格是十万。

上图是TX2,256个GPU核,一般性能好的计算机的开发环境对程序员非常友好,东西全,资料非常多,很快上手。最重要的是TX2非常便宜,教育用户版不到三百美元,可以用它做台式机做不了的事情,供应充足,我们公司用TX2做了非常漂亮紧凑的车载盒子。

其他还有一些性能、定位差不多的芯片,比如NXP,它在车企用的非常多,可靠性、安全性都很好。现在新推出的i.MX8性能稳定,是六核的架构,带GPU,但也有供货问题。它在车载和智能仪表领域的占有率非常高。

另一个是Renesas,一家汽车电子老牌厂家,在自动驾驶计算平台占有一席之地。

为什么我要把它做成分布式的?分布式部署真正是由功能和性能决定的。我们把自动驾驶模块划分一下,有两种分法。一种是Apollo分法,分成四个模块:感知、规划、决策和控制,另一种从性能区分,Sensor、Planning和Action。

现在智能驾驶计算平台的现状如何呢?目前没有一个芯片、计算平台、操作系统能够同时满足上述4个指标。

我们让控制模块跑在可靠的、安全的芯片上,但是满足了安全条件,计算力就跟不上了。感知模块要求强大的计算力,但是这种情况下再做安全,可能成本无法承受。所以最好的办法就是让合适的芯片运行合适的模块,让合适的操作系统来承载合适的模块。

我们把Apollo的四个模块拆分开,感知模块可以跑在高性能的感知平台上,控制模块可以跑在高可靠性的操作系统上。

我们提出一个构想,把控制模块跑在高可靠性的芯片上,感知模块用低成本的处理器。即使一台车要接十二个摄像机,一块芯片不能用了,感知部分摄像机宕掉,问题也不大,车还在控制中。但是控制模块出现问题就不行了。

我们增加了TX2对Docker的支持,使用JetPack3.1刷机。内核缺少containers运行所需的支持,这是我们定制刷新内核的文件,这些都是在网上公开的。编译之后更新,然后重启,重启以后只要带container就说明这个内核已经可以安装到Apollo上了。

增加TX2对Docker的支持

Docker onTegra本身有下面的问题:

• TX-2 or other Tegra devices 不支持nvidia-docker

•  使用JetPack3.1刷机,内核缺少containers 运行所需的支持

•  JetPack3.2解决了这个问题(我还没验证)

•  nvidia-docker wrapper在TX2上不能正常运行,无法获取GPU设备

解决方法是:

•  定制内核,增加对containers 的支持

•  传递所需的参数给Docker,使之能够获取GPU设备

通过如上面几幅图中所述,增加TX2对docker的支持、定制内核配置文件、编译内核、修改Apollo docker脚本后,Apollo docker中可以运行cuda程序了。

编译Apollo

接下来编译Apollo:

•  构建缺少的依赖库:caffe(GPU版),vtk,需要自己写build文件,修改workspace配置文件;

•  重新编译arm版本的依赖库:QPSASES,IPopt,libfastcdr,libfastrtps;

•  重新编译版本不一致的依赖库:glog,gflags,protobuf;

•  修改Apollo中某些不兼容的代码;

感知模块Trafficlight中,caffe只提供了X86平台动态库,X86架构下SSE系列,arm平台无法使用,要么改写,要么直接跳过。

在Apollo中构建tensorRT 开发环境

在Apollo中构建tensorRT,存在以下问题:

•  docker内缺少一系列的库;

•  缺少tx2相机驱动;

•  需要使用tegra定制的libGL.so;

•  libgbm版本不匹配;

•  摄像机守护进程在主机端,docker内无法驱动;

解决办法如下:

1、用挂载或者copy的形式准备好所需的动态库,接近100多个;

12345678
cp host /var/nvidia/nvcam/settings -> dockercp host /var/nvidia/nvcam/input -> docker-v/usr/lib/aarch64-linux-gnu:/usr/lib/aarch64-linux-gnu:ro  \-v/usr/lib/aarch64-linux-gnu/gstreamer-1.0:/usr/lib/aarch64-linux-gnu/gstreamer-1.0:ro  \-v/usr/lib/aarch64-linux-gnu/tegra-egl:/usr/lib/aarch64-linux-gnu/tegra-egl:ro    \-v/usr/lib/aarch64-linux-gnu/mesa-egl:/usr/lib/aarch64-linux-gnu/mesa-egl:ro     \-v/run:/run:rw     \-v/lib/firmware/tegra18x:/lib/firmware/tegra18x:ro        \

2、使用libdrm-2.4.80以上版本重新编译;

3、为tegra版本libGL.so建立软连接;

4、修改主机配置,让摄像机守护进程在docker内启动;

  

构建tensorRT完成后,就可以在Apollo Docker中运行tensorRT,实现12-14帧的多目标检测。

目前成果和后续工作

为大家说一下我们的阶段性成果,目前已发布部分资源供测试:

•   Apollo docker on TX-2的完整镜像;

•   使用不同操作系统重刷Jetpack时会遇到编译错,这里提供完整的内核源码,无需自行下载并执行xconfig;

•   一些需要在arm下单独编译的库;

•   修改的Apollo的docker脚本文件;

•   基于Bazel构建的cuda应用程序开发模板

后续我们将做的工作有:

  • 解决ROS跨版本通信问题

  • 全面使用Nvidia Visionworks对图像操作进行改写

  • 使用TensorRT对深度学习相关的功能模块进行inference优化

  • 对其他车载计算平台的测试和验证

  • 针对QNX的移植适配工作

  • 车载嵌入式设备的封装

到2018年5月份,我们会提出专门针对ADAS的QNX开发包。如果说可以解决ROS跨版本通信的问题,那么我们把Apollo往QNX发展是可行的。

推荐阅读

史海拾趣

Atlantic Microwave Ltd公司的发展小趣事

随着国内市场的饱和,Atlantic Microwave Ltd公司开始将目光投向了更广阔的国际市场。公司组织了一支专业的国际营销团队,深入调研不同国家和地区的市场需求和文化习惯,制定了针对性的市场推广策略。同时,公司还积极参与国际电子展会和技术交流活动,展示公司的最新产品和技术实力,成功打开了多个国际市场的大门。

Belkin公司的发展小趣事

随着电子行业的快速发展,贝尔金也紧跟时代步伐,不断进行技术革新和产品线拓展。2002年,贝尔金为苹果Dock连接器研发了一系列产品,包括汽车套件、电池组、读卡器等,这标志着它与苹果公司的深度合作开始。此后,贝尔金逐渐成为苹果官方合作配件制造商,其产品在苹果用户中享有很高的声誉。

Global Communications公司的发展小趣事
温度传感器的输出与温度之间的线性关系也很重要,因为这直接影响到补偿电路的准确性和稳定性。
富士康(FOXCONN)公司的发展小趣事

FMS深知合作的重要性,积极与行业内外的优秀企业建立长期合作关系。公司现已与伟创力、TCL、比亚迪、OPPO、京东方等多家知名企业建立了良好的合作关系,共同推动电子行业的发展。这些合作不仅为FMS带来了稳定的订单来源,也促进了双方在技术、市场等方面的深入交流与合作。

ECS公司的发展小趣事

为了进一步扩大市场份额,ECS公司开始积极拓展全球市场。他们与全球各地的云服务提供商建立了紧密的合作关系,共同为客户提供更加全面、便捷的服务。同时,ECS公司还积极参加国际云计算展会和论坛,与国际同行交流经验和技术,不断提升自身的竞争力。通过这些努力,ECS公司的品牌知名度和市场份额得到了显著提升。

Banner Engineering公司的发展小趣事

Banner Engineering公司一直将质量管理作为企业发展的核心。公司建立了完善的质量管理体系,从原材料采购、生产制造到产品出厂,每一个环节都进行严格的质量控制。同时,公司还注重持续改进,通过不断优化生产流程、提高生产效率、降低生产成本等方式,不断提升产品质量和企业竞争力。这些努力使公司的产品在市场上获得了良好的口碑和信誉。

问答坊 | AI 解惑

有谁认识熟”红外框”(触摸屏)的电子工程师

招聘熟”红外框”(触摸屏)的电子工程师 我公司想招一个电子工程师,要求:对”红外手写” (也叫触摸屏)非常熟悉的,专职和兼职都可以.工作地点:杭州.(也可在深圳),薪金优 ,有意者可联系我,或把简历发至公司邮箱:bearbear-bear@163.com电话:0755-82132 ...…

查看全部问答>

[笔记].Nios II 软核性能基准.[Nios II]

一些表格 表1 Nios II处理器系统的最大时钟频率(tMAX)(MHz)     表2 Nios II处理器系统的MIPS(每秒钟一百万个指令)       表3 在不同设备家族上的Nios II处理器系统的MIPS/MHz比     表4 Ni ...…

查看全部问答>

如何在wince5.0拔GPRS,打电话,发送接收短信

最近一家公司要求我把我原来在MOBILE的程序移植到他们的设备上,现主要是这三个方面不大清楚怎么移植,没做过wince5.0,不知是否要向他们要除了设备之外的材料?怎么实现…

查看全部问答>

TMS320F240用哪个软件烧写?

知道的说下,找了好长时间了,有的说是CC4.1,有的又说不是,到底哪个软件可以呢 先谢…

查看全部问答>

【MSP430共享】基于蓝牙的高压线电流自动化检测系统设计

在高压危险场所,为提高操作人员的人身安全,使用隔空测量数据是非常需要的,因此采用蓝牙通信系统实现了对远离危险场所进行测量和记录所需数据。本系统使用超低功耗性能优秀的MSP430系列单片机作为核心控制器件,由蓝牙PDA接收信号并对其进行相应 ...…

查看全部问答>

原来ARM7上的ucosii系统要移植到cortex-m3的板子上,求指教

现在主要问题是这个系统原来跑在ARM7的平台上,现在因为某些原因要转移到STM32的平台上。   新的开发平台有现成的ucosii系统+UCGUI,我应该不用再移植了吧, 但是 原来系统里的控制任务要移植过来,不知道一般是怎么移植的,大家都是直接移 ...…

查看全部问答>

陶瓷贴片电容知识

通常大家所说的贴片电容是指片式多层陶瓷电容 (Multilayer Ceramic Capacitors),简称MLCC。它是在若干片陶瓷薄膜坯上被覆以电极桨材料,叠合后一次烧结成一块不可分割的整体,外面再用树脂包封而成的。具有 小体积、大容量、Q值高、高可靠和耐高温 ...…

查看全部问答>

EK-LM4F120 launchpad 之软件安装

我的CCS5是在官网下的就是速度慢     这个是在一个论坛里找到的           http://pan.baidu.com/s/1orfAu     主要这几个选项            剩下的默认就 ...…

查看全部问答>

蓝牙无线传输UUID

怎么通过UUID获取蓝牙传输相应的数据包…

查看全部问答>

MSP430G2553串口问题求助

在编写串口程序之前,小红板子上的32768hz的晶振要不要焊接。…

查看全部问答>