历史上的今天
返回首页

历史上的今天

今天是:2025年03月11日(星期二)

正在发生

2021年03月11日 | 执着于纯视觉感知,特斯拉的底气是什么?

2021-03-11 来源:汽车之家

天下武功,唯快不破!


之前的讲堂我们提到,在自动驾驶的环境感知层面,新势力和传统厂商集体倒向了激光雷达,唯独特斯拉仍在坚持摄像头感知方案。


那么特斯拉坚持纯视觉感知的底气是什么呢?


超前布局闭环学习


其实,特斯拉对自动驾驶有着自己的系统性框架性思考,早在2015年Autopilot面世前,就规划好了一整套数据采集与深度学习的循环模式,并且迫不及待地付诸行动。



2015年10月14日,在特斯拉召开的Tesla OS v7.0系统更新发布会上,马斯克宣布启用Autopilot辅助驾驶系统,这可以看作是特斯拉自动驾驶业务正式启动的标志。


该场发布会的另一则重要信息,是马斯克宣布,每一位Model S车主都是培训专家(expert trainer),特斯拉将通过系统收集各种路况下的行驶数据,训练Autopilot的算法,并通过整车OTA更新完善Autopilot系统。



仅仅一年后,特斯拉就推出了autopolit2.0和汽车行业历史上第一款搭载 8 颗摄像头的车型,前置三目,车身 4 颗,以及后置 1 颗,加上 1 个毫米波雷达和车身周围的超声波传感器。


在自动驾驶尚不成熟的2016年,如此激进地推出Autopilot 2.0和8摄像头车型,无他,只为更全面地收集数据。


截至2021年,特斯拉官网表示,由于每一辆特斯拉汽车都是联网的,特斯拉全球车队收集了超过 100 亿英里(约合 160 亿公里)的真实行驶数据(其中超过10亿英里(约合16亿公里)行驶里程使用了Autopilot自动辅助驾驶系统)。而对比之下,大众集团预计两年后才会有100万辆样车通过车联网向云系统提供数据。



那么,如此庞大的数据,要如何利用呢?


当行驶数据收集录入进云系统后,经过训练,特斯拉的AI神经网络将能够掌握简单场景的驾驶技巧,如沿着高速公路直线段行驶等,但这还远远不够,这时就轮到特斯拉的“影子模式(shadow mode)”登场了。



当我们操纵特斯拉汽车驾驶时,AI神经网络依然在车内运行着,时刻模拟着自主驾驶,影子模式会对比AI神经网络模拟输出的结果与驾驶员的实际操作,当神经网络的输出与驾驶员的真正操作相悖时,相关数据就会上传,特斯拉会利用影子模式的数据不断地优化自动驾驶算法,相当于在向人学习。


自研芯片掌握主动


在搭建软件层面的机器学习闭环的同时,特斯拉也在着手硬件层面的布局。


特斯拉非常清楚 8 颗摄像头对算力的庞大需求,一颗强劲的芯片至关重要,而且芯片特性要适配于自动驾驶。同时,特斯拉也不会放任这么重要的命门握于他人之手,所以,自研芯片是必由之路。




2015 年 12 月,马斯克就亲自找到从AMD离职的芯片大神吉姆凯勒,说服其负责特斯拉自动驾驶芯片的研发。2019 年 4 月,搭载FSD自动驾驶芯片的Autopilot 3.0硬件便正式量产装车。对,就是在国产Model 3简配的那个硬件。


FSD芯片最大的特点就是,只有特斯拉一个客户。这会带来两点优势:


1.FSD芯片可以深刻理解特斯拉 Autopilot 的软件运行机理;


2.砍去通用芯片(如英伟达芯片)中与特斯拉软件无关的模块。



基于这两点优势,特斯拉的FSD芯片架构可以设计得十分精确合理,NPU(嵌入式神经网络处理器)占据了SoC中最大的物理面积。每一块 FSD 计算平台上都搭载了两块完全一致的芯片,每块芯片的算力为 72 Tops,而前代英伟达 Drive PX2 平台的算力为 8 - 10 Tops。与此同时,Drive PX2 的能耗为 57W,而特斯拉 NPU 的能耗为 15W。


Autopilot硬件工程副总裁Pete Bannon表示,他将近 40 年的芯片工程生涯里从未见过新一代芯片性能提升超过 3 倍的,而特斯拉提升了 20 倍(图像帧幅 从2.0版本的110 帧 到3.0版本的2300 帧)。



天下武功,唯快不破,尤其是互联网时代。特斯拉仅用3年就实现了从第一名员工入职到芯片量产装车的完整流程。而且自研的芯片在软硬打通、算法优化等方面都更具潜力,就像去年苹果推出的M1芯片。


超级计算机Dojo是终极杀器?


规模宏大的数据是信息时代最宝贵的矿藏,但想要攫取到数据背后的宝藏,离不开先进的设备,对人工智能来说,这个工具就是超级计算机。


“Dojo”来自日语,意指用来冥想或者练习武术的道场,而特斯拉开发的超级计算机Dojo,就是其用来训练其自动驾驶人工智能的道场。



Dojo的浮点运算能力达到了Exaflops级别。这里简单说明下,浮点数,即FP32,指的是32位储存数字,计算机使用它进行计算。Exaflop指的是计算机每秒可以处理多少浮点运算,1 Exaflop意味着每秒百亿亿次(你没看错单位,每秒百亿亿次)。


特斯拉的Dojo强到什么地步呢?可以做个简单对比,目前世界上最强的超级计算机能够以0.415 Exaflop的速度运行,还未建成的、造价6亿美元、重达4.5万吨的超级计算机“Frontier”的算力为1.5 Exaflop。



Dojo的到来,第一个好处是使特斯拉的Autopilot处理4D视频数据(标注了时间坐标的3D视频数据)成为可能。


我们介绍过,自动驾驶的人工智能识别处理的都是2D图像数据,特斯拉的Autopilot也不例外,再进一步无非是标注了时间坐标的2.5D图像数据。


但是有了“Dojo”,特斯拉就有了应对2.5D到4D数据容量暴涨的底气,投入巨量资源重写Autopilot算法处理4D数据,实现从图像级处理到视频级处理的跃迁。


收集处理的数据变为拥有时间维度的视频信息,系统就能知道目标物的运动,对其行为进行预测,而且,系统处理目标物识别、分类以及场景的重构这类任务会更加轻松,很大程度上提高了系统对整体场景的理解。



Dojo带来另一个好处,是它可以和无监督学习进行配合。


算法的迭代优化离不开基于大数据的训练,但此前机器学习的算法训练主要是监督学习。监督学习,是指算法训练用到的数据需要先进行人工标注,如对图片上的机动车、非机动车、行人、红绿灯等用不同形状的框标注出来。



因为需要大量的人工标注,监督学习一直被揶揄为人工智能领域的“劳动密集型产业”。


无监督学习无需对数据集进行人工标注,系统可以自行根据样本间的统计规律对样本集进行分析和聚类。例如在没有任何标注提示的情况下,仅依据一定数量“狗”的图片特征,系统便可将“狗”的图片从不相关的图片群中区分出来。


有了Dojo和无监督学习的配合,特斯拉便能以极低的成本对数据进行自动标注和训练,实现算法性能的指数级提高。


软硬一体化双轮驱动的商业模式


特斯拉的另一条护城河,是依托“自动驾驶和智能化”的新型商业模式。


不同于传统主机厂商仅依靠前端销售获利,特斯拉更像汽车行业的苹果公司。类似于苹果围绕iOS打造从芯片到系统、再到硬件设计的软硬一体化体系,特斯拉亦在Autopilot、电池和造车三个层面协调统一。



特斯拉正以整车销售为基础,通过“硬件降本+软件加成+Robotaxi共享出行”不断为其商业模式赋能,凭借平台服务加成,拓展盈利空间更广阔的软件业务。虽然特斯拉的整车售价在降,但单车毛利却仍有很大上升空间。


我们以最具想象空间的FSD为例。随着FSD的功能愈发完善,其价格也水涨船高,同时还开通了月度订阅服务模式。国信证券预测,2025年FSD会为特斯拉贡献119.84亿美元的收入,营收端占比提升至12%。



此外,后续内置的功能型软件的激活、娱乐导向的应用型软件变现、中长期订阅服务都有可能成为新增长点。


结 语 


无论是超前布局闭环学习,还是自研芯片打通软硬,亦或是招贤纳才开发超算Dojo,都体现了特斯拉对自动驾驶的狂热。


只是,激光雷达的量产开辟了另一条道路。特斯拉已经在视觉感知的方向上一路狂奔,没法拐弯了,但其他厂商却拥有更多的选择。


就在上周四,全球第一款法律许可的L3级自动驾驶量产车型——本田Legend已经在日本上市,配备5颗激光雷达,可在日本本土的部分路段使用L3级自动驾驶。至于高精地图,则是各地区本土车企对抗特斯拉的大杀器。


自动驾驶固然是美好的愿景,但这一定要建立在安全的基础上。早些年,特斯拉曾有过度夸大驾驶辅助功能的嫌疑,最近一段时间,“自动加速”的事故时有发生。所谓能力越大,责任越大,特斯拉既然在自动驾驶领域有着突出的实力,就更应该让消费者没有后顾之忧。


推荐阅读

史海拾趣

ELMOS公司的发展小趣事

1999年,宝马拥有ELMOS公司股份,为ELMOS参与汽车电子化提供了难得的机遇。自此,ELMOS与宝马建立了紧密的合作关系。通过与宝马的深入合作,ELMOS不仅获得了更多的技术支持和市场资源,还积累了丰富的行业经验。这种紧密的合作关系使得ELMOS在汽车电子领域取得了显著的进展,进一步巩固了其在行业中的领先地位。

CONTTEK Group GmbH公司的发展小趣事

CONTTEK Group GmbH公司深知品质是企业的生命线。因此,公司建立了严格的质量管理体系,从原材料的采购到产品的生产、检测、包装等每一个环节都进行严格把控。这种对品质的执着追求,使得公司的产品赢得了客户的广泛信赖和好评。许多知名电子企业都选择与CONTTEK Group GmbH公司建立长期合作关系,共同推动电子行业的发展。

Digital View公司的发展小趣事

随着技术的不断进步,Digital View公司不断推出创新产品,如高清数字显示系统、智能交互解决方案等。这些产品不仅提高了显示效果,还降低了使用成本,赢得了客户的广泛好评。同时,公司积极拓展市场,将产品销售到全球各地,包括商用/私人飞机、医院、市政交通系统、广播工作室等领域。随着市场的不断扩大,Digital View逐渐成为了平板数字显示领域的佼佼者。

Harris公司的发展小趣事

二战后,随着全球经济的复苏和电气产品的爆炸性需求,Hammond迎来了前所未有的发展机遇。在1950年代和1960年代,Hammond积极扩展产品线,成为变压器、机架、机柜以及电气和电子行业外壳的领先供应商。同时,公司还进行了多次战略性收购,进一步巩固了其在北美电气OEM市场的地位,成为磁性材料的主要供应商之一。

EF Johnson Technologies Inc公司的发展小趣事

在电子通信技术的浪潮中,EF Johnson Technologies Inc公司凭借其卓越的研发团队,成功开发出一款新型无线通信设备,该设备在信号稳定性和传输距离上均取得了重大突破。这一技术突破不仅让EF Johnson在市场上获得了显著的竞争优势,也推动了整个行业的技术进步。随着产品的广泛应用,EF Johnson逐渐确立了其在无线通信领域的领先地位。

FORMOSA公司的发展小趣事

在台湾,一家名为“FORMOSA电子元件制造厂”的公司,起初是一家小型电阻器生产商,专注于为本地电子制造商提供基础元件。随着个人电脑和消费电子市场的蓬勃发展,该公司敏锐地捕捉到市场需求,开始投资研发高精度、低成本的电子元件。通过不断的技术创新和质量控制,FORMOSA电子元件逐渐在国际市场上获得认可,成为多家知名电子产品制造商的供应商。公司还积极拓展海外市场,在欧洲和北美设立分支机构,进一步巩固了其在全球电子元件市场的地位。

问答坊 | AI 解惑

WINCE图像

我想将一个HBITMAP另存为一个GIF或者JPG格式的文件,在WINCE上能实现吗?好像WINCE的系统是16位的,XP系统是32位的,这有什么驱别吗?有哪位朋友有实现的方法呀?…

查看全部问答>

关于如何学习嵌入式 高手 们进

大家好,我是一名大三的学生,学的是嵌入式方向的,但我们现在才学嵌入式操作系统,都TMD还是理论,学了等于没学,就上学期还学了个汇编,现在一学期都快过完了,感觉什么关于嵌入式方面的都没学到,如果靠下学期再来学点东西,以后出去就别想混了 ...…

查看全部问答>

wince+S3C2440功耗问题

用核心板做一款机器,最后做电源管理才发现PWREN给悬空了,且VDDi,VDDiarm和VDDalive一起供电,休眠省电基本不用想了,现在我想仅靠降低CLOCK时钟降低功耗,比如进入SLOW模式,能将2440电流降低到多少?哪位试验过? 另外在wince系统运行时候转换n ...…

查看全部问答>

100分 关于一个程序流程的问题

请教各位帮忙单步跟踪一下下面这个程序 #include   \"stdafx.h\"      #include         #include         using   namespace  &n ...…

查看全部问答>

***IPCamera嵌入式开发合作,有意向者请进***

本公司(知名国企)正在寻求IPCamera(网络摄像机)的技术合作,包括嵌入式开发+硬件设计、中心 管理平台开发。有特色的产品,可提供整机、主板,或者能提供优秀的硬件方案的亦可。     合作方式多种,可技术转让、兼职或者全职。 &nb ...…

查看全部问答>

谁有STM单片机的中文汇编资料,请分享一下

                                 在官方网上找到了一个英文的,看的真累,那位大虾翻译一下,分享出来.…

查看全部问答>

USB口防真器程序编译的问题

程序先前一直没问题,后来改程序又加了几条语句,在编译过程中就有一个错误:Code size limit exceeded(4096 code bytes)for this version of the compiler 4212bytes of CODE memory 10bytes of CONST memory(+4bytes shared) 544bytes of DATA me ...…

查看全部问答>