历史上的今天
返回首页

历史上的今天

今天是:2025年04月15日(星期二)

正在发生

2020年04月15日 | Waymo计算系统猜想

2020-04-15 来源:佐思产研

Waymo惊人的 29 个摄像头的传感器配置在自动驾驶圈内成为热门话题。

 

近日,Waymo 在 Youtube 上发了一段视频专门介绍“WaymoDriver”——自动驾驶巨头的第五代无人车平台。视频主讲人是 Waymo 设计主管 YooJung Ahn(安永君),这位一手打造了“萤火虫”自动驾驶汽车的女设计师给我们分享了新平台的基本设计理念。 安永君是一位出生在首尔的韩国人,实际只是消费类产品工业设计师,并非技术人士,加入谷歌前在摩托罗拉和 LG 做手机工业设计,从未有过汽车外观设计经验,也正因此设计出了萤火虫那样颇为惊艳的小车。她提到了 29 个摄像头,还有许多匪夷所思的性能,比如摄像头可以识别 500 米外的停止标识。众所周知,有效距离与像素数关联程度最高,目前车规图像传感器最高的是索尼的 IMX324,像素为 742 万像素,也只敢说能看清 160 米外交通标识。 Waymo 有能力自己做摄像头,但绝无能力自制图像传感器。Waymo 要么吹牛,要么使用了 2000 万或 3000 万像素的手机用摄像头。这样 Waymo 就离车规量产的距离越来越远了。

 

如此高的数据流量恐怕 5 年内都找不到车规级芯片可对应。Waymo 或者说谷歌从事自动驾驶已经近 11 年,陆续烧掉估计超过 200 亿美元资金,目前仍未有得到验证的商业模式,Waymo 频繁亮相说明 Waymo 已经着急想商业化了,但可能离商业化会越来越远。越复杂的系统,出错的机率越高,进化的成果应该是越来越简洁,早期的手机和电脑的大芯片至少有十几片,今天基本只有两三片。而 Waymo 的传感器却越来越复杂。

 

言归正传。


在 Yole 的报告里,指出第一代 Waymo(第一代 Waymo 无人车应该指的是克莱斯勒大捷龙混动版)使用了 8 个 500 万像素摄像头,到目前也没有车规级的 500 万像素传感器,可以肯定是非车规图像传感器。帧率只有 21fps,尽管如此,带宽已经达 8.7Gbps。

 


第二代 Waymo 无人车应该是指捷豹 I-Pace。

 

 

第二代 Waymo 无人车根据 Yole 的说法,应该采用了 14 个 500 万像素摄像头,带宽是惊人的 15.3Gbps。第二代 Waymo 无人车的传感器(而不是摄像头)有 29 个才更为合理,当然也有可能 Waymo 独辟蹊径,有过人之处,真用了 29 个摄像头。 500 万像素摄像头数据带宽超过 1Gbps,且至少 8 个,这需要非常昂贵的以太网交换机芯片,大多数车规级以太网交换机芯片只能对应 1 路或 2 路 2.5Gbps 带宽输入。目前输入带宽最高的是博通的 BCM53162,可以对应 4 路 2.5GbE,售价高达 650 美元(Mouser 报价,100 片起)左右,14 个 500 万像素至少需要 3 片。

 

 

 

 

上图为 BCM53162 应用图

 

 

上图为 BCM53162 内部框架图


博通对 BCM53162 似乎没有下力气推广,2019 年 3 月就推出了 BCM8956X 和 BCM8988X,但具体参数未对外披露。如果用了 2000 或 3000 万像素的传感器,带宽至少得是 10Gbps,目前没有车规级以太网交换机能对应这么高的带宽。 Waymo 应该不会使用多片交换机芯片,业内更常见的做法是 FPGA 做以太网交换机芯片。FPGA 可以自定义接口,特别适合无人车这种还未出现成熟 ASIC 的领域,缺点是价格昂贵,能够支撑如此多高宽带输入的 FPGA 价格估计最低也在 2000 美元以上。 在视觉计算方面,即便是只使用了 14 个 500 万像素的摄像头,那么如果这 14 个摄像头都做深度学习计算的话,算力至少需要 1000Tops。特斯拉的 FSD 单片算力接近 37TOPS,已经是很高的了。需要指出算力比拼必须看精度,浮点、定点、整数、小数,FP64 为双精度,FP32 为单精度,FP16 为半精度,还有 bfloat16 介于 FP32 和 FP16 之间。

 

通常都是浮点运算,还有更低的 INT8,即整数 8 位精度。做训练用的多 FP64FP32FP16bfloat16,做推理一般是 INT8。 特斯拉的 FSD 是 36.864TOPS,是基于 INT8 的,而谷歌的 TPU V3 是 420TOPS,是基于 bfloat16,如果换成 INT8 精度,至少可以达到 600TOPS,但 TPU 不是针对 INT8 设计的,所以没有这个参数。一般来说,双精度到半精度就是 4 倍,但英伟达的比较特殊,它有可能分开两个针对不同精度的多核,比如英伟达的 GK104,每个 GK104 的 GPU 内含 1536 个 FP32 CUDA Core 和 64 个 FP64  Units ,单精度浮点数 理论峰值 = 2 GPU *1536 FP32 Core * 2 * 745MHz  = 4.58TFlops,双精度浮点数 理论峰值 =2 GPU * 64 FP64 core * 2 * 745MHz = 0.19TFlops。英伟达的 Tesla T4 有 2560 个 CUDA 核对应 FP16,还有 320 个 TURring Tensor 核对应 FP32,FP32 算力为 8.1TFLOPS(浮点),FP16 精度为 65.13TFLOPS(浮点),INT8 精度下可达 130TOPS,INT4 精度下可达 260TOPS。

 


那么 Waymo 有没有可能用自己的独门武器 TPU V3 呢?

 


需要指出 TPU V3 并非是一块芯片,而是 4 片芯片构成的一块板卡,谷歌还有规模更大的 1024 个 TPU V3 组成 TPU V3 POD。TPU V3 采用液冷,每个芯片算力有 105TOPS,TPU 使用 bfloat16 数据。因为深度学习的矩阵运算瓶颈在存储带宽,TPU V3 不计成本使用了 HBM 内存,内存带宽 3516GB/s,是特斯拉的 10 倍以上带宽,FSD 不可能达到 36.8TOPS 的理想状态,某些时候,可能会下降一半。英特尔、英伟达和华为的此类高算力芯片都是不计成本采用昂贵的 HBM 内存,AMD 的民用级产品也有奢侈使用 HBM。

 

之所以这么做就是深知瓶颈在存储而非运算单元本身。TPU V3 未知其功耗,大多数人估计在 200-350 瓦之间,要达到 1000TOPS 以上,得 3 块 TPUV3,功耗高达 1 千瓦,显然更是远离车规了,而成本则会非常惊人。一块 TPU V3 估计价格在 5000 美元以上,3 块得 1.5 万美元。显然远离量产了。最重要的是 TPU V3 是针对训练设计的。车载需要的是推理部分。

 

 Waymo 不大可能用 TPU V3,成本和功耗太高。 目前有关 Waymo 计算平台的唯一公开信息是 2017 年 9 月英特尔的新闻,英特尔声称自 2009 年以来,其一直与谷歌合作开发无人驾驶汽车,同时也与 Waymo 合作,为后者提供 Xeon 处理器、 Arria  FPGA(用于机器视觉)以及千兆以太网的解决方案,以帮助 Waymo 无人汽车实时处理信息。EyeQ5 的算力只有 12TOPS,并且在今年才量产,显然 Waymo 是不可能用 EyeQ5 的。最大可能还是 Xeon 处理器加 Arria  FPGA。

 

 


上图为英特尔设计的无人驾驶计算平台。虽然英特尔写的是 Arria 10 系列 FPGA,但针对深度学习加速,英特尔最常见的是 Stratix10。使用 FPGA 做深度学习加速的典型代表是微软,从 2015 年末开始,微软就在其购买的几乎每台新服务器上部署 Catapult FPGA 板卡。这些服务器被用于微软的必应搜索、Azure 云服务以及其他应用。这也使得微软成为了世界上最大的 FPGA 客户之一。当使用微软独创的 ms-fp8 数据格式(8 位比特精度)时,在 Stratix 10 FPGA 上可以得到 90 TFLOPS 的峰值性能。 Stratix 10 是英特尔 2015 年的产品。2019 底,Stratix 10 升级为 Agilex,Agilex FPGA 芯片基于第二代 HyperFlex 架构开发,相较于上一代的 Stratix 10 FPGA,性能提升了 40%,功耗降低了 40%,DSP FP16 半精度浮点性能最高 40 TFlops(每秒 40 万亿次)、INT8 整数性能最高 92Tops,收发器数据率最高 112Gbps。更高算力的有 Xilinx 的 ACAP 系列 FPGA,最高达 147TOPS(INT8)。

 

 不过 FPGA 的功耗已经不是我们一贯印象中的那么低了,以英特尔 FPGA 的可编程加速卡来说,基于 Stratix 10 SX FPGA(280 万逻辑单元)的 D5005 可编程加速卡,已在 HPE ProLiant DL3809 Gen10 服务器中应用。TDP 高达 215 瓦,Givena specific airflow, the Intel FPGA PAC D5005 can dissipate up to 189 W ofpower,of which up to 137 W can come from the FPGA. 英特尔称一般情况下 D5005 功耗 189 瓦,FPGA 是 137 瓦。而英伟达的 T4 只有 75 瓦,芯片本身只有 70 瓦。D5005 价格也比较高,高达 1 万美元,当然其内部还有 2 个四通道小型可插拔(QSFP)接口,接口速度高达 100G,关键它是可编程的,贵有贵的道理。不过 Stratix 10 SX FPGA 芯片的价格至少也在 3000 美元以上,英伟达的 T4 单芯片价格应该低于 1000 美元。 因此使用英伟达 Tesla T4 的可能性最高,Waymo 可能降低了深度学习模型的精度,可能是 INT2 甚至 INT1,T4 在 INT1 下可达 1040TOPS 算力。

 

 

 

最后说一下 Waymo 的外观,这么多传感器裸露在外,特别是无人车有时行动迟缓,在路口反应不过来,很容易被追尾或剐蹭,这些精密的传感器先不用说更换的成本很高,安装传感器的复杂标定绝非一般 4S 店能完成的,特别是多个传感器合二为一,每一个重新安装都要标定,是单一标定还是联合标定,恐怕只有 Waymo 总部用昂贵仪器才能做到。这样的车保险费会高的惊人。 再有就是这些传感器裸露在外,难免会让小偷觊觎。另外这个巨大无比的车顶部分,传统车厂绝对无法接受,风阻问题就是消耗能源问题。 Waymo 为无人车努力了 11 年,全球最顶尖的人才汇聚,烧掉至少 200 亿美元,直到今天,还是工程样车的模样,离车规量产依然是遥遥无期。


推荐阅读

史海拾趣

Glow-Lite Corp公司的发展小趣事

对于红外遥控发射电路,网友可能会有多方面的问题。以下是一些可能的问题及其详细回答:

一、红外遥控发射电路的基本工作原理是什么?

回答
红外遥控发射电路的基本工作原理是,当用户按下遥控器上的某个按键时,遥控器内部的微控制器(CPU)会读取与该按键对应的二进制数据,并通过信号调理电路进行处理。随后,这些数据被调制电路转换为适合传输的信号,并经过放大后,由红外线发射二极管以红外光的形式发射出去。接收设备上的红外接收头接收到这些红外光信号后,会将其转换为电信号,并经过进一步的处理还原为原始的控制指令,从而实现遥控功能。

二、红外遥控发射电路常见的故障有哪些?

回答
红外遥控发射电路常见的故障主要包括以下几个方面:

  1. 电池电量不足或接触不良:这是最常见的故障之一,当电池电量不足或电池卡簧接触不良时,会导致遥控器无法正常工作。

  2. 按键故障:按键上的导电橡胶易磨损、老化,或按键电路中的铜箔线条断裂、开焊等,都会导致按键失灵。

  3. 振荡电路故障:振荡电路中的陶瓷谐振器易受到机械冲击而损坏,导致振荡频率偏移或停振,进而影响遥控信号的发射。

  4. 红外发光二极管故障:红外发光二极管可能因引脚开焊、内部开路或失效等原因而无法正常工作。

  5. 驱动电路故障:驱动电路中的晶体三极管、电阻等元件可能因开路、放大系数下降等原因导致故障。

  6. 编码集成电路故障:编码集成电路是整个遥控器的核心部分,其内部集成了多个复杂的电路。如果编码集成电路发生故障,将直接影响遥控信号的生成和发射。

三、如何判断红外遥控发射电路是否故障?

回答
判断红外遥控发射电路是否故障,可以采用以下几种方法:

  1. 观察指示灯:如果遥控器上有指示灯,可以通过观察指示灯是否闪亮来判断遥控器是否有红外信号发射。

  2. 替换法:用一个确认无故障的遥控器去控制同一台设备,如果控制有效,则说明原遥控器可能存在故障。

  3. 万用表检测:使用万用表测量遥控器电池电压、按键电阻、红外发光二极管两端电压等,以判断电路是否正常。

  4. 收音机检测:利用收音机的中频载波与遥控器振荡频率接近的特点,通过收音机接收遥控器发出的信号来判断遥控器是否具有发射能力。

四、如何维修红外遥控发射电路的故障?

回答
维修红外遥控发射电路的故障,需要根据具体的故障原因采取相应的措施。以下是一些常见的维修方法:

  1. 更换电池:如果电池电量不足或接触不良,应更换新电池或清理电池卡簧。

  2. 清洁按键:如果按键故障是由于导电橡胶磨损或灰尘等杂物造成的,可以用软布蘸无水酒精清洗按键表面。

  3. 更换元件:如果振荡电路、红外发光二极管、驱动电路或编码集成电路等元件损坏,应更换相应的元件。

  4. 焊接修复:如果电路中存在开焊、断裂等现象,应使用焊接工具进行修复。

  5. 调整电路:如果故障是由于电路参数设置不当或元件老化等原因造成的,应对电路进行调整或更换老化元件。

通过以上方法,可以有效地解决红外遥控发射电路中的常见故障。

Handok Co Ltd公司的发展小趣事

在电子行业中,Hamlin(现为Littelfuse的一部分)的发展充满了创新与挑战的故事。以下是五个关于Hamlin如何在Littelfuse旗下发展壮大的实际案例:

1. 从独立到并购:Hamlin的加入

Hamlin,一家在传感器领域享有盛誉的公司,于2012年被Littelfuse收购。这一战略举措标志着Littelfuse在电路保护基础上,进一步向传感器与功率器件领域扩展。Hamlin的加入为Littelfuse带来了丰富的传感器技术,特别是其在磁性传感器方面的专长,使得Littelfuse能够为客户提供更全面的解决方案。这次并购不仅增强了Littelfuse在汽车电子和工业市场的竞争力,也为其后续的技术创新和市场拓展奠定了坚实基础。

2. 创新引领:55300系列传感器的诞生

Hamlin在加入Littelfuse后,继续发挥其创新优势,推出了55300系列非接触式磁性传感器。这一系列传感器克服了传统干簧开关在机械磨损和污染方面的限制,具有长寿命、高速度、不受恶劣环境影响的特点。其广泛的工作温度范围和集成的汽车级EMI/EMC测试,使得这些传感器在汽车和工业市场得到了广泛应用,如液压缸位置、变速箱换挡位置等关键控制领域。

3. 技术突破:Hamlin在车用传感器领域的贡献

随着汽车行业的快速发展,对安全、节能和舒适性的要求日益提高。Hamlin利用其在磁感应技术上的专长,为Littelfuse的车用传感器产品线增添了新的活力。Hamlin的车用传感器涵盖了安全类、动力总成、排放和舒适性四大类别,通过检测转速、位移、位置和角度等参数,为汽车提供了精准的监控和控制。这些传感器不仅提升了汽车的性能和安全性,也满足了消费者对驾驶体验的高要求。

4. 市场拓展:Littelfuse与Hamlin的全球化战略

在Hamlin的助力下,Littelfuse加快了全球化步伐。通过在欧洲、亚洲和美国的持续扩张,Littelfuse的产品和服务覆盖了更广泛的市场。Hamlin的传感器技术成为了Littelfuse在全球市场上的一张重要名片,吸引了众多国际客户的关注。同时,Littelfuse也加大了对新兴市场的投入,特别是在中国市场,通过与本土合作伙伴的紧密合作,进一步提升了品牌影响力和市场份额。

5. 持续增长与未来展望

自Hamlin加入以来,Littelfuse的业绩实现了持续增长。通过不断的研发投入和市场拓展,Littelfuse在电路保护、传感器与功率器件领域均取得了显著成就。展望未来,Littelfuse将继续依托Hamlin等子公司的技术优势和市场资源,推动产品创新和市场升级。同时,随着新能源汽车、物联网等新兴领域的快速发展,Littelfuse将迎来更多的发展机遇和挑战,为电子行业的进步贡献更多力量。

BRIGHT公司的发展小趣事

除了无线耳机和太阳能领域,BRIGHT公司还在健康技术领域取得了重要的突破。他们成功筹集了60万美元的资金,用于推动健康技术的持续增长和扩张。这笔资金使得BRIGHT公司能够在其成功的基础上,进一步研发和推广基于科学的认知健康解决方案。他们的产品,如40赫兹灯,无需医生处方即可普遍使用,为广大消费者提供了更加便捷和科学的健康管理方式。

Aearo Technologies公司的发展小趣事

Aearo Technologies公司创立于四十多年前,从一开始就致力于能量控制技术的研发。公司凭借创始团队在声学、材料科学和工程领域的深厚背景,成功开发出了一系列高性能的噪声和振动控制材料。这些创新材料为公司在电子行业中树立了良好的声誉,也为其后续发展奠定了坚实的基础。

Custom LeatherCraft Manufacturing Co Inc公司的发展小趣事

CLC起源于一个对高质量手工皮革制品有着无限热情的小型工坊。创始人是一位经验丰富的皮革工匠,他看到了电子工程师和户外工作者对耐用、实用的工具包的需求。于是,他开始了自己的创业之路,以“定制皮革工艺”为核心理念,承诺每一件产品都经过精心制作和严格质检。凭借这份承诺和精湛的技艺,CLC逐渐在市场中赢得了口碑。

Harvatek Corporation公司的发展小趣事

背景:随着全球经济的一体化和电子信息产业的快速发展,Hantronix意识到市场拓展的重要性。公司开始积极寻求国际合作机会,拓展其全球业务版图。

发展:Hantronix通过参加国际展会、建立海外销售网络等方式,成功将产品推向全球市场。其高品质的产品和优质的服务赢得了众多国际客户的信赖和好评。同时,公司还加强了与国际知名企业的合作,共同推动电子显示技术的进步和应用。

问答坊 | AI 解惑

DIY示波器2.0进度:HSMC 接口的转接板和人机界面板(05月21日)

HSMC 接口的转接板和人机界面板的PCB完成了,整个系统由数据采集板,人机界面板,HSMC转接板组成。现在数据采集板的原理图也完成差不多了,这些工作都是主要由Flt9006完成。下面就是要开始做HDL硬件逻辑设计和NIOS软件设计部分了,HDL部分首先完成L ...…

查看全部问答>

lbing7来拿分

对于我这个刚入门的人,lbing7能耐心讲解基础,十分感谢。 由于到目前问的问题都是十分基础的,我就不写出来了。…

查看全部问答>

有没有像3-8译码器这样的 大点的译码器。。如7-128 。。。8-256?

有没有像3-8译码器这样的 大点的译码器。。如7-128 。。。8-256????    我想用的是智能读取300个器件的资料。。想用译码器来管理,这样来节省单片机。。        没办法的情况下我只好用4-16的74LS154连接了, ...…

查看全部问答>

准备酝酿一个玩wince的人的开心网

我们刚创建的wince家园,想让所有玩wince的人变成朋友。 logo都没来得及做。想先看看坛子上面兄弟的看法。 目的是想找同道之人共同参与,共同出出好点子,让我们搞wince的变成一个强大的同盟。 试运行网站 http://www.armce.cn/ 嘿嘿~~~ 预祝xd ...…

查看全部问答>

静态链接库

  各位大侠: 能否将VC6.0生成的.lib文件转换为CE下面能使用的.lib ? 没有源代码。 …

查看全部问答>

wince6.0不识别硬盘,如何解决。可以给钱的。有意联系QQ:284047150

wince6.0不识别硬盘,如何解决。可以给钱的。有意联系QQ:284047150 在工程内增加了exFAT/ATAPI,但是就是找不到硬盘。请问如何解决。…

查看全部问答>

请教版主STM323.0的库函数有没有IIC的问题?

请教版主STM32 3.0的库函数有没有IIC的问题? 正准备做个项目希望 版主 给个答复!!…

查看全部问答>

收到348的套件了,说一下

收到套件 ,发现原装的也是配了很多made in china的东东? [ 本帖最后由 pig163xx 于 2011-10-29 22:10 编辑 ]…

查看全部问答>

请大家注意,用F28027的Lib可能存在Bug!

最近一直在学习F28027的库开发模式,用下来感觉其实一般,Ti官方的手册中也没有一个标准,什么函数什么时候调用,前后有什么顺序要求,就是给了一些例子和函数说明,看起来有些模糊。今天在调试SCI的程序,突然发现用库模式的SCI_LOOPBack_INITTrup ...…

查看全部问答>

launchpad c2000毕设,求高手!求意见!

以LaunchPadXL-C2000为核心板,设计一款可实现正弦波、方波和三角波信号输出的多函数信号发生器。信号频率0.1Hz-1MHz,输出幅度0.1V-5V可调,信号类型、频率及幅度均由按键选定。…

查看全部问答>