历史上的今天
返回首页

历史上的今天

今天是:2024年11月16日(星期六)

2021年11月16日 | 特斯拉全自动驾驶(FSD)计算机及芯片简介

2021-11-16 来源:小明师兄

自动驾驶 Autopilot FSD是特斯拉最核心的应用软件。可以把其软件收入组成分为三块,具体而言: 

 

1)Autopilot FSD(Full Self-Driving)完全自动驾驶选装包。特斯拉著名的自动驾驶的功能,也可以说是特斯拉汽车的灵魂。消费者付费激活后,可以享受到包括自动泊车、自动辅助导航驾驶、智能召唤等在内的高级自动驾驶功能,而且后续可以通过 OTA 空中软件持续升级自动驾驶能力。2020 年 7 月 1 号,其价格已经上涨至 8000 美元/套(国内 64000 元/套)。

 

2) OTA 付费升级。特斯拉此前对于软件的 OTA 升级基本上是以免费的形式提供的。2019年以来,特斯拉开始积极尝试 OTA 付费升级。典型案例就是“Acceleration Boost”加速性能升级包。Model 3 车主只要付费 3000 美元,即可将汽车的百公里加速性能从 4.6s 提升到4.1s。

 

3) 高级车联网功能。特斯拉从 2019 年 Q4 开始,首度开启车联网高级连接服务收费(9.9美元/月),车主支付了服务费后即可使用实时路况、卡拉 OK、流媒体等高级车联网功能。

 

其中,OTA 付费升级以及高级车联网功能两块业务是特斯拉从 2019 年开始逐步发力的软件业务。现阶段,FSD 是特斯拉最核心的应用软件,其软件收入也主要由 FSD 选装包贡献。

 

 

 

完全自动驾驶芯片(FSD芯片,以前的自动驾驶硬件3.0)是特斯拉设计的自动驾驶芯片,在2019年初为他们自己的汽车推出。特斯拉声称,该芯片的目标是自主4级和5级。FSD芯片采用三星的14纳米工艺技术制造,集成了3个四核Cortex-A72集群,共有12个CPU,工作频率为2.2GHz,1个Mali G71 MP12 GPU,2个神经处理单元,工作频率为2GHz,还有其他各种硬件加速器。FSD最多支持128位LPDDR4-4266内存。

 

FSD芯片的设计和规划始于2016年,当时特斯拉声称他们没有看到适合他们解决自动驾驶问题的其他解决方案。FSD芯片项目由吉姆-凯勒和皮特-班农以及其他建筑师领导。该设计团队于2016年2月成立。开发工作在18个月内完成。2017年8月,该芯片被发布用于制造,第一批硅片于2017年12月完全工作回来。对设计进行了一些额外的修改,需要重新制作。

 

2018年4月,B0步进被发布到制造业。B0的全面生产在2018年7月获得资格后不久开始。2018年12月,特斯拉开始用新的硬件和软件堆栈对员工汽车进行改造。2019年3月,特斯拉开始在其Model S和Model X汽车中批量运送FSD芯片和计算机。2019年4月,在特斯拉Model 3中开始生产出货。

 

 

完全自动驾驶芯片或简称FSD芯片是特斯拉自制的定制设计的自动驾驶芯片。该芯片自2016年以来一直在开发,并在2019年初进入量产阶段。作为特斯拉现有汽车的升级产品,FSD芯片继承了先前解决方案的大部分功率和热要求--包括保持100瓦的最大功耗。由于芯片本身是专门为特斯拉自己的汽车和他们自己的要求设计的,替代性神经处理器的大部分通用能力已经从FSD芯片中剥离出来,只留下他们需要的硬件设计。

 

在高层次上,该芯片是一个完整的片上系统,能够启动标准的操作系统。它是由三星在德克萨斯州奥斯汀的工厂采用14纳米工艺制造的,在260毫米见方的硅片上装有大约60亿个晶体管。FSD芯片符合AEC-Q100-2级汽车质量标准。选择成熟的14纳米节点而不是更前沿的节点,归结为成本和IP准备。有12个64位ARM内核,作为三个四核Cortex-A72内核集群,工作频率为2.2GHz,用于通用处理。还有相对较轻的GPU,主要设计用于轻量级的后处理。它的工作频率为1GHz,能够达到600GFLOPS,支持单精度和双精度浮点运算。该芯片具有一个相对低成本的传统内存子系统,支持128位LPDDR4内存,工作频率为2133MHz。

 

 

安全系统


有一个安全系统,它包含了一个双核锁步CPU,对汽车执行器进行最终仲裁。这个CPU确定由FSD计算机上的两个FSD芯片产生的两个计划是否匹配,以及驱动执行器是否安全(参见§操作)。

 

安全系统的设计是为了确保芯片只执行经过特斯拉加密签名的代码。

 

相机串行接口


FSD芯片有一个摄像机串行接口(CSI),能够从各种视频输入设备中每秒处理多达25亿个像素。

 

视频编码器


FSD芯片集成了一个H.265(HEVC)视频编码器,用于各种应用,如倒车摄像头显示、仪表盘和云剪辑记录。

 

图像信号处理器


FSD集成了一个图像信号处理器(ISP),其内部24位流水线旨在处理特斯拉汽车上配备的8个HDR传感器,能够每秒处理多达10亿个像素。ISP具有色调映射功能,使芯片能够暴露出由于明/暗点(如阴影)而产生的额外细节。此外,ISP还具有降噪功能。

 

神经处理单元


FSD芯片集成了两个定制设计的神经处理单元。每个NPU包含32 MiB的SRAM,旨在存储临时网络结果,减少对主存储器的数据移动。整体设计相当简单明了。每个周期,256字节的激活数据和另外128字节的权重数据从SRAM中读到MACs阵列中,在那里它们被合并。每个NPU有一个96x96的乘积阵列,总共有9,216个MAC和18,432个操作。对于FSD芯片,特斯拉使用8位乘8位的整数乘法和32位整数加法。对这两种数据类型的选择主要是由于他们努力降低功耗(例如,32位FP加法的功耗大约是32位整数加法的9倍)。在2GHz下运行,每个NPU的峰值性能为每秒36.86万亿次运算(TOPS)。每块芯片上有两个NPU,FSD芯片的综合峰值性能可达每秒73.7万亿次运算。在点乘操作之后,数据被转移到激活硬件、池化硬件,最后进入汇总结果的写缓冲器。FSD支持多种激活功能,包括整流线性单元(ReLU)、Sigmoid线性单元(SiLU)和TanH。每个周期,128字节的结果数据被写回SRAM。所有的操作都是同时和连续进行的,重复进行直到完成整个网络。

 

一些硬件已经被简化,这就把复杂性放到了软件上。这样做是为了降低硅的成本,以支持稍微复杂的软件。软件可以映射和分配单个SRAM库。在特斯拉的NN编译器的帮助下,还可以进行层融合,通过耦合conv-scale-act-pooling操作来实现数据重用。编译器还执行层平滑,确保一致的内存访问,添加旨在减少库冲突的通道填充,并插入DMA操作以在使用前预取数据。在代码生成过程中,权重数据被生成,代码被压缩,并生成一个CRC校验以保证可靠性。

 

在正常操作下,神经网络程序在启动时被加载,并在芯片通电的整个过程中保持在内存中。运行是通过设置输入缓冲区地址(如新拍摄的图像传感器照片),设置输出缓冲区地址,和权重缓冲区地址(如网络权重),设置程序地址,然后运行。NPU会异步地自行运行整个神经网络模型,直到达到停止指令,触发中断,让CPU对结果进行后处理。

 

FSD计算机的设计是为了加装到现有的特斯拉车型上,因此在外形尺寸和I/O方面基本相同。计算机本身正好可以放在汽车手套箱的后面。FSD计算机可以由技术人员安装在与先前的自动驾驶硬件2.5板相同的插槽中。板子本身包含了两个完全独立的FSD芯片,以及它们自己的电源子系统、DRAM和闪存,以实现完全冗余。每个芯片从自己的存储存储器启动,并运行自己的独立操作系统。在板子的右边(如下图所示)是八个摄像头的连接器。电源和控制装置在电路板的左侧。该板位于两个独立的电源上--一个用于FSD芯片,一个用于另一个。此外,一半的摄像机位于一个电源上,另一半位于第二个电源上(注意,视频输入本身是由两个芯片接收的)。冗余的设计是为了确保在一个组件,如摄像机流或电源或板上的一些其他IC坏了的情况下,整个系统可以继续正常运行。

 

操作


当通电并启动时,感官输入从各种来源输入到电路板。其中包括当前的汽车读数,如惯性测量单元(IMU)、雷达、GPS、超声波传感器、车轮转速、转向角和地图数据。有8个外部视觉摄像头(在某些车辆上有1个内部摄像头)和12个超声波传感器。数据同时被送入两个FSD芯片进行处理。这两个芯片独立形成汽车的未来计划--汽车接下来应该做什么的详细计划。然后,来自两个芯片的两个独立的计划被发送到安全系统,安全系统对它们进行比较,以确保达成一致。一旦来自两个芯片的两个计划在计算的计划上达成一致,汽车就可以继续前进并按照该计划行动(即操作执行器)。然后,驱动命令被验证,感觉信息被用作反馈,以确保命令执行了所需的操作。整个操作循环以高帧率连续运行。

 

功耗


运行完整的软件堆栈,FSD计算机耗散了72W。这比之前的解决方案HW2.5所耗散的57瓦特多了大约25%。在这72瓦中,包括由NPU耗散的15瓦。与HW2.5相比,运行确切的软件堆栈和传感器,特斯拉报告说每秒的帧数提高了21倍。

 

 



推荐阅读

史海拾趣

Altera (Intel)公司的发展小趣事

Altera是一家以FPGA(可编程逻辑器件)和相关技术为主的半导体公司,于1983年成立于美国加利福尼亚州的圣塔克拉拉。以下是关于Altera公司发展的五个相关故事:

  1. 成立与早期发展:Altera公司由Robert Hartmann和Michael Magranet等人创立,最初以设计和制造EEPROM(可擦除可编程只读存储器)为主。1984年,Altera推出了全球第一个可编程逻辑器件EP300系列,开创了FPGA行业。随后,Altera不断扩大产品线,致力于FPGA技术的研发和推广。

  2. FPGA技术创新:Altera在FPGA技术方面持续进行创新,推出了一系列新产品和技术。1992年,公司推出了第一个基于SRAM(静态随机存储器)的FPGA器件,从而实现了更高的速度和灵活性。随后,Altera不断改进器件结构、设计工具和软件支持,提高了产品性能和用户体验。

  3. 与竞争对手的竞争:在FPGA市场,Altera与Xilinx是两大竞争对手。两家公司在技术、产品性能、市场份额等方面展开激烈竞争。为了在市场上取得优势,Altera不断加大研发投入,推出了更具竞争力的产品,并积极开展营销和销售活动。

  4. 收购与合并:Altera在发展过程中进行了一系列收购与合并,以扩大市场份额和提升技术实力。2015年,英特尔公司以约160亿美元的价格收购了Altera,将其并入英特尔旗下,成为英特尔的子公司。这一收购使英特尔获得了Altera在FPGA领域的技术优势和市场份额,进一步巩固了英特尔在半导体行业的领先地位。

  5. 公司发展与创新:作为英特尔的子公司,Altera继续发展和创新。公司不仅致力于FPGA技术的进一步改进和推广,还在其他领域进行探索和拓展,如数据中心、人工智能、物联网等。Altera不断推出新产品和解决方案,满足不同行业和应用领域的需求,保持了在半导体行业的竞争优势。

以上是关于Altera公司发展的五个相关故事,这些故事展示了Altera从成立初期到被英特尔收购的发展历程,以及其在FPGA技术领域的技术创新、市场竞争和业务拓展等方面的重要进展。

CP Technology Inc公司的发展小趣事

CP Technology Inc一直注重产品质量和客户服务。公司建立了严格的质量管理体系,从原材料采购到生产过程控制,再到产品检测和售后服务,都力求做到精益求精。这种对品质的执着追求赢得了客户的广泛赞誉和口碑传播,为公司的长期发展奠定了坚实基础。

Advanced Semiconductor, Inc.公司的发展小趣事

为了进一步扩大市场份额,ASI积极寻求与全球各大电子企业的合作。通过与这些企业的战略合作,ASI不仅获得了更多的订单和市场份额,还进一步提升了自身的技术水平和创新能力。同时,ASI也积极参与国际半导体行业的交流和合作,与全球同行共同推动半导体技术的发展。

ADTech公司的发展小趣事

随着企业规模的扩大和影响力的提升,AdTech公司开始更加关注自身的社会责任和可持续发展。公司积极参与公益活动,支持教育、环保等事业,为社会的发展做出了积极贡献。同时,公司还注重环境保护和资源利用,通过采用环保材料和节能技术,降低生产过程中的能耗和排放。这些举措不仅提升了公司的社会形象,也为其实现长期可持续发展奠定了坚实基础。

这些故事是基于对AdTech公司可能发展路径的假设和推测而创作的,并不代表该公司的实际发展情况。实际上,每个公司的发展都是独特而复杂的,受到多种因素的影响。如需了解更多关于AdTech公司的真实发展情况,建议查阅相关新闻报道、行业报告或公司年报等权威资料。

Gaomi Xinghe Electronics公司的发展小趣事

背景:随着中国经济的快速发展和消费者对电子产品需求的不断增加,Galaxy公司敏锐地捕捉到这一市场机遇。

行动:在2003年初,Galaxy以缜密的市场调研为基础,全力部署进入大陆市场。同年6月,公司推出了以“影驰”命名的Geforce家族系列产品,迅速吸引了众多游戏发烧友和电子产品爱好者的关注。随后,公司又在多个城市设立了销售和服务网点,为消费者提供更加便捷的产品体验和服务。

成果:经过多年的深耕细作,Galaxy在大陆市场取得了显著成绩,品牌影响力不断增强,市场份额稳步提升。

场效应半导体(Cmos)公司的发展小趣事

韩国三星电子(Samsung Electronics)在CMOS技术方面也取得了显著成就。作为一家综合性电子企业,三星电子在CMOS技术研发方面投入了大量资金和人力资源。通过不断的技术创新和生产优化,三星电子成功推出了多款高性能、低功耗的CMOS芯片产品,广泛应用于智能手机、平板电脑等电子产品中。这些产品以其卓越的性能和出色的品质赢得了市场的广泛认可,使三星电子在全球半导体市场上占据了一席之地。

问答坊 | AI 解惑

四路输出D/A转换器DAC8420及其应用

本帖最后由 dontium 于 2015-1-23 13:30 编辑 1 DAC8420的主要特点  DAC8420是AD公司生产的四路输出12位DAC。该DAC具有高速串行接口,而且功耗很低,能广泛应用于伺服系统控制、过程自动化控制及ATE中。其主要特点 ...…

查看全部问答>

AR——科幻小说的实现者

AR技术诞生于上世纪90年代前半期,现已广泛应用于电影及电视节目等。例如,通过合成的背景影像使得身在演播室的主持人看上去就像真的置身于大自然一般。除了电视领域以外,AR技术在夜视仪及战斗机飞行员使用的标靶显示等军事应用中也取得较大发展, ...…

查看全部问答>

设置2410双主USB在wince中

设wince4.2默认定制的内核USB是一主一从,请问怎样才能改成双主的?是不是一主一从和双主是不能共存的?…

查看全部问答>

关于PCI的的一点问题

老板让做个东西,要dsp通过PCI传数据给电脑,请问这个是不是有什么现成的模块可用呢?…

查看全部问答>

WINCE的版本 与开发工具的匹配问题

要开发wince下的软件,查到如下资料     开发工具的版本号是与Windows CE的版本号对应的。微软提供给应用程序开发者的工具包括:Embedded Visual Tools 3.0,其中包括Embedded Visual C++ 3.0和Embedded Visual Basic 3.0;Embedded Vis ...…

查看全部问答>

u-boot-1.1.5 找不道nand_probe()函数

最近在进行smdk2410开发扳上u-boot移植,最后连接是出现 \"unreference to nand_probe()\"错误,未发现这个探测函数,急! 各位高手帮个忙…

查看全部问答>

新手急求---keil中ulink setting失去响应

电脑可以发现keil ULINK.驱动应该没什么问题.连上过一次.因为上来就要做串口.不知道哪里的问题...貌似是没成功,后来再连.在keil中设置ULINK就会失去响应.不能结束进程.要注销windows.. 用的keil是RVMDK 3.80a ,ulink1,STM32 103系 另外win7系统 ...…

查看全部问答>

高性能,低成本,TI针对Altera Cyclone IV: 3.3-V的TPS54318解决方案

The Altera® Stratix™ IV FPGA参考设计展示了TI TPS54318…

查看全部问答>

【 信号处理】一种基于FPGA的语音录制与回放系统的设计

随着微电子技术的发展,系统集成向高速、高集成度、低功耗发展已经成为必然,同时SoPC技术也应用而生。SoPC将软硬件集成于单个可编程逻辑器件平台,使得系统设计更加简洁灵活。SoPC综合了SoC,PLD和FPGA的优点,集成了硬核和软核CPU、OSP、存储器、 ...…

查看全部问答>