历史上的今天
返回首页

历史上的今天

今天是:2025年03月04日(星期二)

正在发生

2021年03月04日 | 借助并行处理和异构计算,超越摩尔定律

2021-03-04 来源:EmbeddedComputing

image.png?imageView2/2/w/550

2021年嵌入式处理器报告指出:随着晶体管缩放的每瓦性能改变逐渐接近尾声,下一代处理器将如何为负载提供更具效率的计算能力?答案是通过异构SoC上的并行处理得出。


“我们一直致力于7纳米技术,在那段时间里,我们不仅看到了摩尔定律的终结,而且还看到了Amdahl定律和Dennard定律的终结。”赛灵思硅市场营销总监Manuel Uhm说:“这就是说,如果我们要做的仅仅是将FPGA从之前的节点16 nm缩小到7 nm,那么许多客户可能会尝试采用完全相同的设计,并且最终的设计可能不会提高性能,而且实际上还会增加功耗。”


“显然这是完全错误的方法。”


需要明确的是,将硅晶体管缩小到7 nm以下并不是没有可能。 5 nm器件已经在生产中。这是因为底层的运行速度没有加快,而且漏电流也在增加。


同时,从另一个方向来看,传统的多核设备已经达到了自己的扩展极限。当然,这些并行处理器在历史上一直是同类的,“事实是,没有一个处理器架构可以最佳地完成每个任务。” Uhm表示:“不是FPGA,不是CPU,也不是GPU。”


image.png?imageView2/2/w/550

[图1.“没有任何一个处理器架构可以最佳地完成每个任务。不是FPGA,不是CPU,也不是GPU。”]


这并不是说并行处理在解决现代应用程序所呈现的复杂处理任务方面没有优势。实际上,除了摩尔定律和Dennard缩放比例之外,并行计算可能是我们在高性能计算(HPC)和其他苛刻用例中的最佳选择。


是的,我们仍然需要并行处理。但是种类繁多。


异构处理:不仅用于数据中心


如前所述,异构并行处理技术的前沿是对高端应用中性能壁垒的回应。但是这些架构在嵌入式计算环境中也变得越来越普遍。


VDC Research的高级分析师Dan Mandell指出:“的确,许多异构处理架构确实专注于高端应用,尤其是数据中心和HPC。FPGA SoC和其他异构加速芯片的小型化是重中之重。 Microsemi和Xilinx等公司希望将更多此类设备带入边缘/工业服务器和IoT网关等智能边缘基础架构中。”


Mandell认为,嵌入式市场中通用异构计算平台的主要驱动力“是OEM和当今其他人对致力于硬件体系结构的犹豫。这种犹豫是专业加速芯片快速发展的结果,以及未来几年边缘软件和AI生态系统将产生的框架和工作负载的不确定性。


他预计所有这些情况“将对未来的半导体采购产生重大影响”,以及芯片供应商如何制定处理器路线图。


Mandell认为:“当今大多数FPGA SoC的价格和功率范围将迫使供应商最初将重点放在相对高端,高资源的嵌入式和边缘应用上。但是,人们正在积极努力使FPGA SoC尺寸减少,以最终支持电池供电的连接设备。”


image.png?imageView2/2/w/550

[图2 | Xilinx Versal VC1902是一款7 nm器件,包含Arm Cortex-A72和Cortex-R5F CPU内核,400个AI引擎,DSP块以及重要的可编程逻辑,所有这些都使用片上可编程网络集成在一起。


因此,随着异构并行处理变得越来越普遍,嵌入式工程师是否应该为系统设计的范式转变做好准备? Nvidia嵌入式与边缘计算副总裁兼总经理Deepu Talla并不这么认为。


“如果您考虑一下,嵌入式处理器一直都在使用加速器。”Talla说。“即使在20年前,也有一个Arm CPU,一个DSP,然后在特定的硬件上完成了视频编码/解码,对吗?从某种意义上说,它们是固定功能,但是它们都是并行处理的。”


他继续说:“您需要这样做的原因是成本,功率,尺寸。并行处理器的效率比CPU高出几个数量级。”


Nvidia的Xavier SoC(其Jetson Xavier嵌入式平台的核心设备)以及该公司的下一代Orin架构(将于2021年或2022年末推出)均配备GPU,Arm CPU,深度学习加速器,视觉加速器,编码器/解码器和其他专用处理模块(图3)。


image.png?imageView2/2/w/550

[图3 | Nvidia Xavier SoC配备了基于Arm的Carmel CPU,Volta GPU,深度学习和视觉加速器以及其他可以并行处理工作负载的固定功能计算块。]


然而,随着高级异构SoC越来越普及,嵌入式开发人员可以期待的一个变化就是片上网络(NoC)互连的使用,该互连在过去十年中已经从传统的片上总线(如AMBA接口)发展而来。Talla说:“这提供了连接CPU,GPU,视频编码器,深度学习加速器,显示处理器,摄像头处理器,安全处理器以及所有这些东西的方式。”


NoC帮助加速和优化整个SoC之间的数据流,从而有助于最有效地执行工作负载。例如,恩智浦在其多功能i.MX SoC系列产品中同时利用了NoC和传统总线体系结构。最近,该公司宣布了i.MX9(图4)。


image.png?imageView2/2/w/550

[图4 |恩智浦i.MX9系列将结合实时和应用处理器,专用EdgeLock加密处理器以及神经处理单元(NPU),以及其他计算模块。]


“异构计算是我们实际上已经实施了很多年的东西。我相信,现在正是我们真正开始使用它的时刻。” 恩智浦半导体公司边缘处理业务和技术战略主管Gowrishankar Chindalore博士表示,“在机器学习中也是如此,因为我们今天使用的是CPU,GPU,DSP和神经处理单元(NPU)。


“但这只是优化的一部分,不仅是计算元素,除了异构计算之外,我们着重提高效率的地方,还着眼于芯片划分流水线,避免视频流水线和图形流水线中的整个流程的浪费。”


他补充说:“因为我们能做到的越多,我们获得的性能就越高,显然,用于执行相同功能的精力也越少。”


走向异构世界


Mandell引用VDC Research的2020年IoT,嵌入式和移动处理器技术报告,预计嵌入式SoC的全球市场将“继续超越MPU,MCU,GPU等单一芯片的商业市场。在OEM寻求合并计算资源和多芯片实现的过程中,我们将在接下来的几年中实现这一目标。从长远来看,对工作负载加速和处理器优化的需求只会进一步推动这种趋势。”


同时,我们衡量性能和功耗的方式也必须改变。正如Linley Group的高级分析师Mike Demler在《深度学习处理器指南》中所说,即使是以AI为中心的新基准(例如TOPS / W)也“具有误导性,因为真正的AI工作负载永远无法达到100%的利用率。”


他说,我们将不得不通过“实际工作量,例如Bert NLP模型,而不是基于理论的,基于体系结构的规范”来衡量电源效率。


但是,不再单独测量处理器复杂度是否有意义?真的有关系吗?与往常一样,重点将放在系统上下文中所提供的内容上。


“在每个流程节点之前,就像‘噢,太棒了。我获得的性能是功耗的一半,那些日子已经一去不复返了。在7纳米时,晶体管漏电流开始急剧增加。您还会遇到其他类型的问题,我们认为这是无法克服的。”


“因此,意识到这一点后,我们现在正在研究系统级问题。我们将所有这些东西放在一起,并了解所有这些权衡取舍,并确保我们能够涵盖所有这些问题。尽可能多地进行处理,以使性能和功耗预算得到满足。这些不再是一件容易的事。我们意识到,我们将能够提供更高的性能或更低的功耗,不一定会同时两者兼得。”


“再次,没有处理器适合所有情况。您无法始终提高性能并降低功耗。” Uhm继续说道。 “但是专注于这种新的架构,即异构处理器,本质上可以使他们做到这一点。”

推荐阅读

史海拾趣

Franel Corp公司的发展小趣事

法勒公司始终将技术创新视为企业发展的核心驱动力。在中国市场,法勒不断推出适应本土需求的新产品和解决方案,如非接触供电系统、智能故障诊断系统等。这些创新技术不仅提升了物流设备的智能化水平,还为客户带来了更高的效率和更低的运行成本。法勒的技术创新不仅赢得了市场的广泛认可,也推动了整个物流装备行业的技术进步和产业升级。

兆易创新(GigaDevice)公司的发展小趣事

面对中国市场的多样化和个性化需求,法勒公司积极提供定制化解决方案。无论是复杂的物流系统改造,还是特殊环境下的设备供电需求,法勒都能凭借其专业的技术团队和丰富的项目经验,为客户提供量身定制的解决方案。这种以客户为中心的服务模式,不仅增强了客户粘性,也进一步巩固了法勒在中国市场的领先地位。

ECM [ECM Electronics Limited.]公司的发展小趣事

ECM Electronics Limited.自创立之初,就注重技术创新。公司投入大量研发资金,专注于开发高效、节能的电子产品。通过不断的技术迭代和产品创新,ECM成功推出了一系列具有竞争力的产品,逐渐在市场上建立了良好的口碑。同时,公司还积极与高校和科研机构合作,引进先进技术,为公司的持续发展提供了强大的技术支撑。

浙江凡华(FANHAR)公司的发展小趣事

随着公司规模的扩大和产品线的丰富,ECM Electronics Limited.开始积极拓展市场。公司不仅在国内市场取得了良好的销售业绩,还积极开拓国际市场,将产品出口到多个国家和地区。为了更好地服务全球客户,公司还设立了海外办事处和研发中心,加强与国际市场的联系和合作。通过国际化战略的实施,ECM进一步提升了品牌知名度和市场竞争力。

Bellin公司的发展小趣事

面对日益严重的环境问题,ECM Electronics Limited.积极响应国家节能减排的号召,将绿色发展和可持续发展作为企业的重要战略。公司采用环保材料和节能技术,降低产品能耗和排放。同时,公司还积极参与环保公益活动,推动行业绿色发展。这些举措不仅提升了公司的社会形象,也为公司的长期发展奠定了坚实的基础。

3M公司的发展小趣事

企业文化是企业发展的灵魂。ECM Electronics Limited.注重企业文化的建设,倡导“诚信、创新、协作、共赢”的价值观。公司注重员工的培训和发展,为员工提供良好的工作环境和职业发展机会。通过团队建设活动,增强员工的凝聚力和归属感。正是这些积极向上的企业文化和优秀的团队,为ECM Electronics Limited.的持续发展提供了源源不断的动力。

问答坊 | AI 解惑

求助:单颗LED的电源驱动设计

我现在有一颗LED需要驱动,6.5V,20mA。 需要做一个驱动器,希望可以控制电流大小,不需要连续调节,只需要在0mA和20mA之间切换就行。怎么做最好? 电源有开关电源可以提高。…

查看全部问答>

How to select TVS

This is MicroNotes ,which writed by Kent Walters .Tell you how to select TVS.…

查看全部问答>

关于Protell99的前景

现阶段很多朋友,特别是刚出学校的都喜欢用Protell99,这款软件对于来讲自我感觉确实还不错,但是我有很多朋友并不看好它,认为其POWER PCB更为先进…

查看全部问答>

2808最小系统

这里有高手做过2808的最小系统吗?…

查看全部问答>

AD中两个元件相距太近时报错,怎么办?

AD中两个元件相距太近时报错,在哪里可以调节这个这个值啊(允许的最小间距)…

查看全部问答>

uclinux和linux是不是应用层接口一样的?

就是说是不是linux的应用层软件可以不改动直接移植到uclinux上?…

查看全部问答>

电机上电瞬间引起单片机复位的问题

驱动信号已经通过光耦隔离,复位电路是低电平复位,vcc接电阻,电容接地,是什么原因呢?…

查看全部问答>

串口 应答信号

我想设计一个通信协议,我的1号机发出握手信号后收不到2号机的应答信号,但是我把2号机和PC机的串口调试助手直接连接就能收到应答信号,为什么?大家帮我看看我的程序那里的问题好吗? void serial() interrupt 4 using 1     &nbs ...…

查看全部问答>

eeworld上可用分怎么计算的,回复一个贴子就有10分可用分?回复自己的贴子有没可用分?戴红花什么意思?奖牌表示什么?eeworld上游戏规则是什么?

eeworld上可用分怎么计算的,回复一个贴子就有10分可用分?回复自己的贴子有没可用分?戴红花什么意思?奖牌表示什么?eeworld上游戏规则是什么?…

查看全部问答>

[求助]用汇编实现辛普森积分

怎样用汇编语言实现辛普森数字积分? 下面是C程序,哪位能帮忙搞个汇编版本的?只要有辛普森函数那部分就可以 /*-------复化辛普森求积公式---------*/ #include #include #include #define N 100 /*-------将要被求积的函数------*/ doubl ...…

查看全部问答>