历史上的今天
返回首页

历史上的今天

今天是:2024年10月23日(星期三)

正在发生

2018年10月23日 | 看完这篇文章,你就知道你特斯拉Autopilot V9强在哪里

2018-10-23 来源:eefocus

今年 10 月,跳票已久的 Autopilot V9 版本终于落地,Musk 吹过的牛也在一步步实现。媒体上关于 Autopilot V9 的溢美之词不绝于耳,但却没人能从技术角度说说这次的 V9 到底牛在哪里。好在民间有大神,在特斯拉论坛上,就有一位神经网络从业者对 V9 进行了深入剖析。看完他的分析,你对 Musk 的崇拜恐怕要再多几分。

 

记者对神经网络工程师 jimmy-d 的论坛发言进行了整理和编译,各位读者可千万别错过这份营养满满的技术大餐。

 

 

统一的摄像头网络让 8 颗摄像头火力全开

与前一个版本的 V8 类似,我认为 V9 的神经网络中也用到了“摄像头网络”,它能直接处理来自摄像头的输出。当然这还不够,特斯拉还准备了一套“后置处理网络”,它能将“摄像头网络”生成的数据变成更高级别的抽象,而且已经拥有了可操作性。与 V8 相比,V9 有了巨大的跃升。

 

这个“摄像头网络”到底强大到什么地步呢?

 

它能一次控制 8 颗摄像头。需要注意的是,V9 上所有摄像头采集的图片和视频权重都是一样的(V8 有所不同,不同摄像头采集的数据重要程度不同)。

 

具体来说特斯拉这 8 颗摄像头:

 

前置的 3 颗与后置的 1 颗处理分辨率均为 1280x960(释放了摄像头的最高分辨率);

 

剩下的 4 颗摄像头则用了 640x480 的处理分辨率(其实这 4 颗摄像头与前后那 4 颗最高分辨率相同,但在这里只用到了其分辨率的四分之一)。

 

*注:特斯拉的 8 颗摄像头包括 3 颗前置摄像头,它们中有一颗是窄视角摄像头,覆盖范围可达 250 米,一颗是中程摄像头(主摄像头),能看 150 米远,另一颗则是广角摄像头,但覆盖范围仅 60 米。另外车尾还有 1 颗摄像头,剩下 4 颗则对称安装在车辆转向灯下放和 B 柱上。

 

除此之外,这 8 颗摄像头均升级到了 3 条色彩通道(红绿蓝 3 条色彩通道),且用上了双层架构设计。与其相比,V8 上的 2 条色彩通道(红绿 2 条色彩通道)+单层架构设计就寒酸多了。而且别忘了,V8 的摄像头分辨率只有 640x416,且只有主摄像头和窄视角摄像头有这“待遇”。

 

传闻称 V8 的多个版本也给那 4 颗比较“闲”的摄像头配备了神经网络,但它到底派没派上用场恐怕只有特斯拉内部人员才知道。

 

可以肯定的是,V8 时代 Autopilot 驾驶时只用到了主摄像头和窄视角摄像头,而那颗前置广角摄像头是用来感应雨水的。不过在 V9 上,这 8 颗摄像头确实是火力全开。

 

除了摆脱摄像头“闲置”的骂名,V9 的神经网络处理能力还大幅提升。拿主摄像头来说,1280x960 的分辨率与 3 条色彩通道和双层架构设计叠加,每帧文件大小就能达到 1280x960x3x2 字节,换算过来就是 7.3 M。反观 V8 的主摄像头,每帧输入只有 0.5 M,数据量是 V9 的1/13。

 

与谷歌的 Inception V1 神经网络相比(两者用了类似的底层架构概念),V9 的摄像头网络规模要大上 10 倍,算力更是提升了 200 倍。

 

虽然侧方的 4 颗摄像头分辨率只有主摄像头的1/4,但 8 颗摄像头火力全开,13 倍的数据输入量虽然加大了 ECU 的压力,但也能提供更为精细的物体细节。

 

更为有趣的是,摄像头接口发生了改变,V9 上每一帧都是成对处理。不过,这些成对处理得画面还是有时间偏差的,延迟大致在 10-100 毫秒,这样才能呈现出动作,而动作能提供深度信息并将物体从背景中分离出来,帮助车辆识别并预测物体轨迹(包括车辆自己的轨迹)。

 

对系统的基础感知来说,这个升级至关重要。

 

图像处理网络效率大跃升

在 V8 上,主摄像头和窄视角摄像头用了相同的架构,但权重有差异。

 

这点并无问题,毕竟两颗摄像头有完全不同的视场。分别训练两颗摄像头会大大降低物体识别的难度,同时神经网络的规模和训练量也会有所下降。不过这也意味着你必须打造两个不同的训练数据集并分别对它们进行评估,而且在运行时两个不同的神经网络还要交替上线。

 

在 V9 上,特斯拉则用上了独立的图像处理网络(Camera Agnostic,意为独立于摄像头),它能在相同权重下处理任何摄像头的输出数据。同时也能解决 V8 上神经网络的问题并提升其稳定性。

 

这种解决方案也意味着神经网络必须更了解物体到底长什么样,无论镜头畸变有何不同(畸变无法用物理方式修复)。此外,独立的图像处理网络很烧钱,因为它需要大量的训练、海量的数据库和一个规模庞大的神经网络。

 

当然,特斯拉选择这样一个解决方案也不是为了给自己找麻烦。这套独立的图像处理网络在计算效率上有了较大提升。当它只需要依照一个权重时,就不用频繁在 GPU 中写入各种数据。更重要的是,你可以在一个数据集的框架下大批量处理各种摄像头采集的图像了。这样一来,同等的硬件就能获得性能加成。

 

我从来没想过有厂商愿意搞这种独立的图像处理网络,特斯拉真给力!

 

怪物级别的神经网络

如果要用一个词形容 V9 的神经网络,恐怕你脑海里第一个蹦出来的词是怪物,但事实上它比怪物还要强悍。当你将神经网络里的一个权重乘以 5,就会发现你得到的不只是 5 倍的能力提升。

 

在表达能力上,神经网络的提升服务更是几何级的。打个比方,如果 V8 的表达能力是 10,那么 V9 就是 100000,绝对是爆炸性的性能飞跃。不过,想用好这个性能飞跃,就需要训练数据也配合着增加,你“喂给”神经网络的数据量可能是原来的数百万倍。

 

(*注:其实数据方面特斯拉并不担心,毕竟和 Waymo 相比,它们奔跑在路上的车辆要多得多。数据显示,2016 年年底特斯拉售出车型的行驶里程已经高达 35 亿英里,随着大量 Model 3 入役,想必 Musk 的数据库都快塞不下这些数据了,而时不时就实现一个里程碑的 Waymo 才累积了 1000 万英里的路测历程。)

 

简单来说,这套神经网络比我见过的任何视觉神经网络都要庞大,只是想想它需要的学习数据我都感觉不可思议。为了万无一失我甚至算了很多遍,但最终我惊奇的发现,限制我的并非计算方法,而是我的想象力。

 

V9 神经网络上的变化让车辆有能力识别任何方向上的每个物体,其探测距离甚至能达到数百米。同时,它还能抓住这些物体的瞬间动作。如果考虑到摄像头视场的重叠,每出现一个物体,至少会被两颗摄像头发现,这就大大提升了车辆安全性。

 

在 V9 上,特斯拉是不是用了半监督学习?特斯拉使用的数据肯定有一部分不带标签,毕竟谁能找来这么多人给天量的数据加标签?

 

在我看来,特斯拉的模拟测试设计师们肯定打造了一台专门生成数据标签的机器,不过即使这样恐怕加了标签的数据也不够用。而且,特斯拉去哪找这么狂暴的数据中心来训练神经网络呢?难道 Musk 是谷歌背后的神秘人,能从 Larry Page 那弄来一整个仓库的 TPU?

 

也许 Musk 又在酝酿什么神秘的杀手锏了。

 

总而言之,在 V9 上我看到了特斯拉的能力和野心。

 

特斯拉总是能实现业内专家都无法想象的进步,这种通过改进“放大”计算能力、训练数据和产业资源的能力是特斯拉的核心竞争力之一,同时也降低了未来研发路上的不确定性。

 

从这个角度来看,特斯拉的“视觉优先/全神经网络”模式确实前程远大。作为一名神经网络界的从业人员,我为特斯拉感到骄傲。


推荐阅读

史海拾趣

Elektron公司的发展小趣事

随着技术的不断进步和市场需求的不断变化,Elektron公司不断进行技术创新和产品升级。公司成功开发出适用于船上使用的单点和多点焊接整流器以及弧光灯的电影整流器等产品,进一步扩大了市场份额。同时,Elektron还注重产品质量和性能的提升,通过引进先进的生产设备和工艺,不断提高产品的可靠性和耐用性。

Computer Conversions Corp公司的发展小趣事

Computer Conversions Corp非常重视人才的培养和团队建设。公司定期组织内部培训和技术交流活动,鼓励员工分享经验和创新想法。同时,公司还建立了完善的激励机制,为员工提供广阔的发展空间。这种以人为本的管理理念,不仅增强了团队的凝聚力和创新力,也为公司的持续发展注入了强大的动力。通过这些举措,Computer Conversions Corp打造出了一支高素质、高效率的技术团队,为公司的长远发展奠定了坚实的基础。

Avalon Photonics公司的发展小趣事

Avalon Photonics深知技术创新是公司发展的核心动力。因此,公司每年都将大量资金投入研发领域,不断推动技术创新。公司研发团队积极探索新技术、新材料,在光子学领域取得了多项重要突破。这些技术创新不仅提升了Avalon产品的竞争力,也为公司在市场上赢得了良好的声誉。

FUJIKURA公司的发展小趣事

Avalon Photonics的创立源于一次技术突破。创始人Dr. Smith在光子学领域有着深厚的学术背景,他成功研发出了一种新型的光子探测器,具有极高的灵敏度和稳定性。这一创新技术迅速引起了业界的关注。Dr. Smith看到了商业化的潜力,于是决定成立Avalon Photonics,将这项技术转化为实际产品。初创期的Avalon面临着资金短缺和市场认知度低的挑战,但凭借着技术优势和团队的努力,逐渐在市场上站稳脚跟。

EMC [ELAN Microelectronics Corp]公司的发展小趣事

随着公司的发展,义隆电子不断加大研发投入,致力于技术创新和产品多元化。公司拥有一支高素质的研发团队,拥有多项自主知识产权和核心技术。通过不断的技术创新和产品升级,义隆电子成功推出了微控制器、个人计算机外设芯片、数字显示器芯片等一系列具有市场竞争力的产品。同时,公司还积极拓展智能型人机接口技术之应用芯片等新兴领域,为未来的发展奠定了坚实的基础。

Condor公司的发展小趣事

作为一家有社会责任感的企业,义隆电子一直积极履行社会责任,致力于可持续发展。公司注重环境保护和资源节约,采用环保材料和节能技术生产产品。同时,公司还积极参与公益事业和社会活动,回馈社会。这种注重社会责任和可持续发展的企业文化使得义隆电子在行业内树立了良好的形象。

以上五个故事简要概述了义隆电子股份有限公司(Elan Microelectronics Corp.)在不同发展阶段的关键事件和成就。这些故事展示了义隆电子在技术创新、市场拓展、人才培养和社会责任等方面的努力和成就。

问答坊 | AI 解惑

哪位好心人帮帮我发一个keil软件给我

我的keil 老是出错, 比如: void main(void) { unsigned int w; w=10; } 程序执行到‘}’结束符就出错。 ***   error   65:   access   violation   at   C:0x0A00  &nb ...…

查看全部问答>

pxa310开发板

Marvell? PXA310?开发板简要介绍 产品图片 Product Photo PXA310 简介 PXA310 处理器专门为手持设备、GPS 定位系统、无线手持和其他消费类电子设备而设计。基于第三代Intel XScale 技术的这一Marvell PXA3XX 应用处理器系列产品(内部称为Mon ...…

查看全部问答>

渥瑞达“3G移动开发”免费试听课于北京交通大学举行,欢迎大家光临!

渥瑞达“3G移动开发”免费试听课于北京交通大学举行,欢迎大家光临! 渥瑞达“3G移动开发”免费试听课于北京交通大学举行,欢迎大家光临! 详情请参见 www.neworigin.net 同时欢迎大家与我们的609期学员交流!这期学员已与2月11日毕业 ...…

查看全部问答>

请教STM32的MCO输出给5V器件CLKIN的方案?

打算用MAX7456,需要个27M的晶振。想把晶振省掉,用STM32的MCO来输出给它。 该CLKIN输入datasheet如下,VDVCC是5V供电。 下载 (31.48 KB) 2011-1-28 09:37 打算STM32用9M的晶振,PLL用6倍频到主时钟54M,然后MCO用PLL ...…

查看全部问答>

能提供CCS for c6000 v2.2补丁程序下载?

CCS for c6000 v2.2补丁程序下载 地址  能提供么…

查看全部问答>

我用一个数组输出一个三角波,为何输出的是这样的啊

我用一个数组输出一个三角波,为何输出的是这样的啊  不是三角波,而是一下一下的向上跳动?…

查看全部问答>

STM32虚拟串口驱动如何一次发送261个数据给上位机?

我设备的需求是:将网卡接收到的一帧数据(一帧包括261个数据,每个数据都是一个十六进制如0xc2),通过USB发送到上位机。      我将STM32的USB虚拟串口驱动(V3.1版)按照我的要求进行修改并实现了该功能,起初我USB虚拟串口 ...…

查看全部问答>

基于RL78G14的双轮自平衡小车进度贴--体验心得

感觉特别不习惯瑞萨的编译器,比起keil iar 感觉差了不止一大截,可能习惯问题吧。 然后就是他那个芯片手册,引脚介绍的非常详细,功能、寄存器介绍方面我感觉还是有些不足的,看了半天不知道配置,可能是没有demo的原因,后来从这里http://am.ren ...…

查看全部问答>

ucos-ii的移植代码分析

移植的代码中,在时钟SysTick_Handler中OSIntExit()进行任务切换; 其中OSIntExit()的代码为: void  OSIntExit (void) { #if OS_CRITICAL_METHOD == 3                 ...…

查看全部问答>