历史上的今天
今天是:2024年12月04日(星期三)
2020年12月04日 | Xilinx CTO:自适应计算将延续摩尔定律的精神
2020-12-04 来源:EEWORLD

本文作者:赛灵思(Xilinx)CTO Ivo Bolsens
芯片架构的发展正在加速,因此采用正确的工具来完成正确的工作至关重要。
世界变得越来越智能。从口袋里的智能手机到当今管理交通和运输系统的智慧城市,人工智能几乎遍及每个行业,并正在影响我们的日常生活。人工智能产生了大量非结构化数据,这些数据通常必须实时进行管理和处理。对硬件的需求猛增,越来越依赖芯片架构的创新来提供必要的性能改进以跟上步伐。
摩尔定律的持续改进需要数千名工程师、数百家公司、数百亿的研发来实现,人工智能芯片同样如此,这不是一个适合所有应用的单一规格,也不会是一个公司或芯片架构占主导的市场。
那么,您的硬件如何适应AI处理的不断增长的需求?答案是域特定体系结构(DSA)。DSA是计算的未来,其中定制了硬件以运行特定的工作负载。DSA使计算,内存带宽,数据路径和I/O与应用程序工作负载的特定需求紧密匹配。与通用CPU和GPU架构相比,这提供了更高水平的处理效率。
ASIC的缺点
可以使用专用的芯片来构建DSA,但是这样做可能会有缺点。首先,我们希望的关键部分是对更快,更好,更便宜以及更早满足需求。为了跟上创新的步伐,制造商在比以往更短的时间内创建并提供创新服务。更具体地说,比设计和构建新的基于ASIC的DSA所需的时间更少。这在加速创新的市场需求与设计和构建ASIC所花费的时间之间造成了市场错位。
其次,ASIC很难做。设计高级节点ASIC的复杂性呈指数增长,大大增加了风险。一个小的错误可能会产生巨大的影响,其中至少包括非经常性工程(NRE)成本。例如,7nm时,仅在NRE中,ASIC的成本就高达数亿美元,随着器件几何尺寸缩小至5nm甚至更高,成本还会进一步上升。
第三,ASIC实现方式无法满足未来需求,更改行业标准或其他波动性要求会很快使该设备过时,这些只是固定芯片的一些缺点。
那么,行业如何才能继续在架构上取得进步,并以足够快的速度建立DSA以跟上创新的步伐?解决方案在于自适应计算。
自适应计算的力量
自适应计算以FPGA技术为基础,可以动态地在芯片中构建DSA。因此,自适应计算允许DSA随着需求的变化而动态更新。使我们摆脱了漫长的ASIC设计周期和高昂的NRE成本。它不仅支持软件而且还支持硬件的无线(OTA)更新,这在处理变得更加分散时尤其重要。例如,2011年火星漫游者的好奇心以及最近推出的“恒心”都包含了自适应计算技术。
毅力号为其全面的视觉处理使用了自适应计算。它使用基于FPGA的平台构建,可加速AI和非AI视觉任务,包括图像校正,过滤,检测和匹配。毅力号发送回NASA的图像将使用自适应计算进行处理。
如果在八个月内发明了一种新算法,或者发现了硬件错误,毅力号无法在途中进行升级。在这种情况下,自适应计算允许通过空中或太空远程发送硬件更新。这些更新可以像软件更新一样快速、轻松地完成。当部署是远程的时,这样的远程硬件更新不仅是方便,而是必要的。
自适应计算可以从云部署到边缘再到端点,从而将最新的架构创新带到端到端应用的每个部分。这归功于广泛的自适应计算平台——从数据中心PCIe加速卡上的大容量设备,到适合IoT设备所需端点处理的小型,低功耗设备。
自适应计算可用于构建各种形式的优化DSA,从对延迟敏感的应用(如自动驾驶和实时视频流)到5G中的信号处理以及非结构化数据库的数据处理。借助当今的硬件抽象工具,软件和AI开发人员现在可以充分利用自己的优势,而无需成为硬件专家。
自适应计算可加速整个应用
AI推理很少单独存在。它是较大的数据分析和处理链的一部分,通常具有使用传统(非AI)实现的多个前段和后段。这些系统的嵌入式AI部分当然可以受益于AI加速,非AI部分也可以受益于加速。自适应计算的灵活性适合于加速AI和非AI处理任务。我们称此为整个应用加速,随着AI渗透到越来越多的应用中,它将变得越来越重要。
我们已经讨论了自适应计算的功能,但还有更多技巧。
启用全新系统
自适应计算使全新的系统成为可能,而其他技术则无法实现。它不仅可以实现快速的架构创新,还可以在系统运行时在架构之间进行切换。这些新系统可显着提高性能,降低功耗和成本,而对于固定芯片(如CPU,GPU和ASIC)来说,这是不可能的。
例如,在现代车辆中,有许多摄像头,每个摄像头都由软件和越来越多的AI进行监控。前置摄像头和后置摄像头的处理通常是互斥的——根据行进方向,一次只能监视一个摄像头。自适应计算允许他们共享处理资源。向前移动时,只需要处理前面的视频流,而向后移动时,只需要处理后面的视频流。当汽车从“行驶”移至“倒车”时,硬件将重新配置为实现后置摄像头处理算法,该算法可能与面向前方的算法不同。这样可以提供更高的整体性能,但同时可以降低功耗和成本。对于最终用户而言,这意味着可以用更少的钱获得更多的功能。
结论
摩尔定律已死。
但是,摩尔定律的精神仍在。
DSA等自适应计算和架构方面的进步有助于维持我们已经养成的更快、更好、更便宜的追求。同时,自适应计算通过消除构建新的基于ASIC的DSA所需的漫长设计周期,满足了“更快”的市场需求。这种趋势将继续推动架构的飞速发展,从而使摩尔定律的精神得以延续。
史海拾趣
|
TI首席科学家方进——What is new with SoCs 最近工作需要用到,找到一份资料与大家分享下 What is new with SoCs By Gene Frantz TI Principal Fellow and Business Development Manager, DSP Another comment we received recently was from Shreshtha Kumar, questioning all of our hy ...… 查看全部问答> |
|
本人想用128x64液晶制作一个简单的人机交互界面,但由于所有显示字符都是先用字模转换软件转换出来的,所以现在想要动态显示字符,就遇到了困难。希望高手指教!谢谢!… 查看全部问答> |
|
我想用单片机通过串口控制GPRS,单片机的波特率是9600,gprs是115200,请问怎么设置gprs和单片机通信时的波特率? 我想用单片机通过串口控制GPRS,单片机的波特率是9600,gprs是115200,请问怎么设置gprs和单片机通信时的波特率?我是新手,请各位知道的帮帮忙!… 查看全部问答> |
|
为什么S3C6410自带的I2C只能发一个Slave Address,之后CLK一直是低 我在调试S3C6410驱动时,用的是友坚恒天开发板,代码是WINCE600\\PLATFORM\\SMDK6410\\SRC\\DRIVERS\\IIC中的IIC 驱动,结果写一个数据到I2C, S3C6410的I2C master 只发出了一个Slave Address,之后CLK一直是低,I2C master再也不发了。从驱动程序上 ...… 查看全部问答> |
|
我现在在学mcs-51系列,但我这小地方没有电子元器件的市场,我想弄一套接线方式可自由拔插的。最好其它的配套学习资料,开发说明、软件都有的那样,方便学习!!… 查看全部问答> |
|
我接入一个压力传感器,输出10多mV,直接接入ad通道,打开内部缓冲器,内部放大倍数为最大,内部基准电压,采集输出只能达到12位左右,但是我外部放大后将内部放大器的增益调到1,AD转换可以达到16位,为什么?内部放大器怎么没太大用处。… 查看全部问答> |




