历史上的今天
今天是:2024年09月03日(星期二)
2019年09月03日 | 实现中国车规级AI芯片量的产零突破!地平线推出征程二代
2019-09-03 来源:爱集微
人工智能?自动驾驶?听着就让“芯片”觉得压力山大,在对算力的双重超高要求下,如何推出一款面向复杂场景的车载AI芯片是一道业界难题。
车规级AI芯片有多难做?
首先,对于自动驾驶芯片而言,毫秒级的低延迟是安全之根本。自动驾驶技术虽然有望减少96%的车祸率,但这是以芯片拥有超低延迟为前提的。
其次,自动驾驶技术带来的海量计算,对芯片的功耗提出了极致要求。在车载环境下的数据吞吐量非常巨大,一辆自动驾驶汽车每天能够产生600-1000TB的数据计算,而且未来将成为主流的新能源汽车本身也是通过电池供能的,在封闭环境中散热很困难。所以车载AI芯片需要具备极低功耗的特性。
海量计算还需要更强悍的计算平台资源作为支撑,但这会带来很高的成本。如果芯片的成本能够相对更低,这将为产品的竞争力添砖加瓦。
低延迟、低功耗、低成本,提出要求很简单,怎么去解决就需要设计人员耗费心血了。国内AI 芯片技术公司地平线创始人余凯博士指出,抛开芯片的这些基础特性,首先要闯的一关就是车规级验证。地平线于今(30)日刚刚推出了中国首款车规级AI芯片——征程二代(Journey 2)边缘人工智能视觉芯片。
据了解,车规级质量测试标准(AEC-Q100)需要经过环境压力加速测试、使用寿命模拟测试、封装组装整合测试、电气特性确认测试、瑕疵筛选监控测试和封装凹陷整合测试。
普通的消费类电子产品对环境工作温度的要求是0~85℃,而车规级的要求是-40~125℃;前者的最大缺陷故障率为0.03%,而车规级要做到硬件故障率为0。
车规级芯片产品的开发周期长、难度大,是硬科技的比拼和长跑道的创新。余凯表示,车规级就意味着极高的安全性、可靠性和稳定性要求。在车载半导体领域,跑在前面的公司就会一直跑在前面,因为这样的公司拥有非凡的、超常的技术壁垒。
全面优化的征程二代
“我们的企业文化就是:耐得寂寞。”余凯在谈到车规级产品的开发时说道。
据余凯介绍,地平线的征程二代已经通过了AEC-Q100测试标准,该芯片采用台积电的28nm HPC+工艺制造,搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4 TOPS的等效算力,更重要的是典型功耗只有2瓦。
具体来说,征程二代还具有以下四大极致效能:
极高的算力利用率:典型算法模型的算力利用率大于90%。
极高的算力有效性:配合高效的算法,每TOPS 算力可以处理的帧数可达同等算力GPU的10倍以上。
出色的感知可靠性:典型目标的识别精度超过99%,延迟小于100毫秒。
卓越的感知丰富性:可以识别超过60个类别的目标,每秒目标识别数量超过2000个。
关于征程二代为何效能如此之高,地平线的联合创始人黄畅向集微网表示,主要得益于地平线首重效能、兼顾灵活的BPU架构。
除了BPU,地平线还重新定义了AI处理器性能的评估方式,经典的芯片性能评估方式是PPA,包括Power(功耗)、Performance(性能)和Aera(面积),传统AI芯片真实性能往往通过TOPS/Watt(能效比)和TOPS/$(性价比)来体现。
但黄畅指出,真正的AI芯片性能还包括算法处理速度和精度,算力的利用率以及算力转化为AI性能的效率等。随着算法的演进,趋势是用更少的计算次数达到更高的AI性能,征程二代芯片对于典型、高效、先进的算法可以保持芯片利用率大于90%,而GPU只能做到20~30%。
黄畅强调,全面的优化还要包括编译器和Runtime的优化,以及连接芯片的软件优化,而不仅仅只有算法和芯片的优化。
据介绍,芯片的内部和外部都有存储器。如果使用片外存储器,那么传输带宽仅为10G/s,传输延迟高达100ns,传输功耗大约为640PJ。但是如果使用片内存储,那么传输带宽将达到1000G/s,延迟则低至5ns,传输功耗同样也降低到5PJ。
所以,地平线将数据和计算拆分至合适大小在片上缓存,采用多级并行、数据复用的方式,直接在片内完成,达到降低功耗和提升性能的目的。通过编译器的自动优化,可以将单帧计算延迟降低一半, 单帧带宽也从142MB降低到34MB。
黄畅表示:“地平线的征程二代芯片设计较为激进,这是为了适应未来最主流的算法,让处理器继续高效运行。”
过去、现在和将来
地平线成立于2015年,是台积电全球首个AI芯片客户。2017年,地平线基于人工智能专用计算架构BPU,成功流片量产了中国首款边缘人工智能处理器 “征程”系列处理器和专注于AIoT的“旭日”系列处理器,并已大规模商用。
今年年初,地平线车规级芯片征程二代成功流片后,已在高级别自动驾驶、辅助驾驶(ADAS)、多模交互等方向斩获多达5个国家的客户的前装定点,并有望于明年上半年获得双位数的前装车型定点。
在美、德、中、日全球四大主流汽车市场地平线获得了多家重量级客户的认可,已同包括奥迪、博世、上汽、广汽、长安、比亚迪等国内外顶级Tier 1和汽车厂商,以及禾赛科技、高新兴、首汽约车、SK电讯等科技公司及出行服务商达成战略合作。
基于征程二代,地平线还推出了Matrix二代自动驾驶计算平台及视觉感知方案。相比上一代Matrix,Matrix二代在算力提升高达16倍的同时,功耗仅为原来的2/3,同时可支持高达800万像素的视频输入,行人检测距离高达100米。
伴随着征程二代芯片正式量产,地平线还推出了AI芯片工具链 Horizon OpenExplorer(地平线“天工开物”)。Horizon OpenExplorer 包含面向实际场景进行AI算法和应用开发的全套工具。
关于未来,地平线上海芯片研发中心总经理吴征透露,搭载BPU3.0的征程三代芯片将于明年正式推出,该芯片将符合AEC-Q100和ISO 26262车规级标准。届时,基于该芯片的新一代Matrix自动驾驶计算平台算力将高达192TOPS(特斯拉最新自动驾驶平台为144TOPS)。
地平线副总裁 & 智能驾驶产品线总经理张玉峰则兴奋的表示,征程芯片两年内将有百万量级的前装装车量,五年内有望完成千万量级的目标。
众所周知,车载AI芯片是自动驾驶实现大规模落地的前提,但它也是人工智能行业的珠穆朗玛峰。此次地平线率先推出首款车规级AI芯片不仅实现了中国车规级AI芯片量产零的突破,也补齐了国内自动驾驶产业生态建设的关键环节。
余凯博士表示:“未来,地平线将持续发挥AI时代底层赋能者的核心优势,秉持开放赋能的心态,助推自动驾驶时代早日到来。”
史海拾趣
|
本帖最后由 jameswangsynnex 于 2015-3-3 19:58 编辑 在中国,京东方科技集团(BOE Technology Group)及华星光电技术(Shenzhen China Star Optoelectronics Technology)等本土企业将从2011年下半年开始利用第7.5代(底板尺寸为1950mm×2250mm) ...… 查看全部问答> |
|
VirtualAlloc,分配的空间大小可以超过32MB吗? 我的开发板有128M的内存。 OS分配32MB RAM分配32MB 显存分配64MB 这样可以吗? 显存的空间需要用VirtualAlloc来做,我的bsp里是这么做的,但是它限制大小为小于32M。… 查看全部问答> |
|
大家在开发windows CE应用程序时候. 一般是用SDK还是用MFC? 用MFC是否比SDK生成的代码量大很多. 实时性能也会比SDK的差? … 查看全部问答> |
|
还有我这里有一个 泓格PISO-730 PCI总线开关量输入/输出卡 买的时候有光盘,但怎么也装不上去 发现新硬件“网络控制器”但是安装驱动以后怎么也装不上 估计我装的方法有问题或者有别的什么问题 请教达人指点,小弟在这 ...… 查看全部问答> |
|
用IAR调试一段程序,出现如下状况,请问是什么意思? PS:我没设置断点 [ 本帖最后由 zzbaizhi 于 2012-2-24 14:57 编辑 ]… 查看全部问答> |
|
╮(╯▽╰)╭学了好久的课程,不过已经第四批了,还没有轮上我。好想用用那个触摸板啊。难过之余,发给各位同学一份资料。这是我们培训时,官方给的培训光盘里面的资料。希望对大家的学习有帮助。所以求人品,,,,,,希望下一批的名单里面有我啊 ...… 查看全部问答> |




