历史上的今天
返回首页

历史上的今天

今天是:2025年08月03日(星期日)

2021年08月03日 | 全面计算雄心!一文解构“十年磨一剑”的Armv9新架构

2021-08-03 来源:EEWORLD

近日,在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。


 image.png?imageView2/2/w/550

安谋科技高级FAE经理邹伟现场演讲


Armv9:凭何改变高性能计算方式?


纵观半导体设计在过去十多年的发展,特别是在终端消费等领域,算力带来的生产力的提升,通过移动互联网把大量的计算力放到每一个消费者的手中。与此同时,传统依赖于人工采集和分析数据的过程在第五波计算浪潮中正演变成机器对机器之间的数据采集、存储、分析和服务。由此产生的海量数据需要在云端、边缘侧配置更为强大的算力,并通过数据中心对获得的数据进行分析、构建和决策。


Arm在成为移动浪潮主流架构之外,已进入到边缘端和云端等新场景,其独特的定位可为行业实现稳固的安全基础,同时确保开发者以最简便、快速的方式来使用Arm的安全技术。据邹伟介绍,截止至2020年底,基于Arm IP的芯片累计售出1800亿颗,涵盖在各行各业每一个角落,每一个地方。共享的数据一定会有一个或多个环节经过Arm处理器计算,无论是数据采集的IoT设备,还是日常使用的手机、智能电脑,甚至服务器、超级计算机等。


据Arm预测,未来十年合作伙伴基于Arm芯片的出货量将超过3000亿,100%的共享数据将在Arm芯片上进行处理,无论是在终端还是在云端。因此,亟需一款全新的处理器架构在未来十年内改变计算的方式,以提供更高的性能、改善安全功能并增强工作负载功能。


 image.png?imageView2/2/w/550

邹伟现场介绍全新Armv9架构特性


“为此,Arm正式推出了面向未来十年的新一代架构Armv9,是在目前已经广泛使用的Armv8的基础上,继续使用AArch64作为基准指令集,保持了向下兼容性,在此基础上分别在安全性、AI与ML以及可伸缩矢量扩展和DSP上做出改进,扩展了应用范围。”邹伟表示,“Armv9构架实现的处理器可用于移动计算、HPC高性能计算、汽车和AI等市场等,以满足全球对功能日益强大的安全、人工智能和专用处理的需求,这意味着基于 Arm 架构的计算技术也将在智能手机以外的市场上获得领导地位,借助移动生态系统带来的巨大规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”


Arm全面计算解决方案赋能终极数字体验


尽管近些年全球半导体产业风云变幻,但提供先进算力始终是产业发展的根本目标。从这个角度来看对芯片设计企业又将面临哪些挑战呢?邹伟分析道,首先是CPU的负载越来越复杂,多样化不同的场景中会需求不一样,每个环节面临的挑战都不一样;而摩尔定律虽然减缓,但市场对性能、功耗的追求依然没有停歇,这也是一大挑战;此外,高昂的掩膜价格以及生产周期变长,设计一款5纳米的芯片成本会非常高、生产周期又非常长。“我们希望芯片设计不仅覆盖当前的应用,也能覆盖以后的应用,以获得更长的生命周期,这要求我们通过架构、设计、IP来应对这些客户遇到的挑战。”他强调道。


如果赋能终极的数字体验是Arm构建未来计算愿景的驱动力,那Arm提出最新全面计算解决方案则是开启Armv9时代未来十年之旅的第一步。Arm全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。


 image.png?imageView2/2/w/550


作为Arm全面计算解决方案的基石,全新的Arm Cortex CPU包括Arm目前性能最强大的Arm Cortex-X2、首款基于Armv9架构的大核CPU Arm Cortex-A710以及Arm过去四年来推出的首款高效率小核Arm Cortex-A510和Armv9-A CPU 群集。为支持生态系统对于性能的需求,Arm的全球合作伙伴正在努力确保所有app都将在今年年底前支持64位。正如邹伟在演讲中所述,算力多样化时代,Arm认为CPU的算力水准依然非常重要,它搭建了数字未来的基础底座。


而在每代CPU性能动辄20-30%的大幅提升背后,是Arm对频率、带宽、时延、缓存、工艺水平等各项指标一点点提升的不懈追求,在计算基础架构的创新上一直牵引着行业的进展。因此除了提升CPU性能之外,Arm全面计算解决方案同样希望做系统级的提升,为客户带去更好的设计体验。


此外,视觉体验是消费者与设备交互、并享用设备的关键。据悉,最新的Arm的Mali系列GPU正搭配全面计算解决方案中的Armv9 CPU,可以提供卓越的用户体验。据邹伟透露,未来Mali系列GPU也将持续超越大家的期待,带来光线追踪技术、可变速率着色VSR技术以及其他高级渲染技术等。


 image.png?imageView2/2/w/550


Arm 的互连技术对于提高系统性能同样至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术与Arm CPU、GPU和NPU IP无缝搭配,可跨SoC解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,并支持更高的安全性、改进的带宽和延迟。


引入全新安全性功能,守护数据核心资产


随着全球联网设备激增,芯片的安全性日益重要。对安全性的根本需求是重新思考如何处理安全性,而Armv9架构则通过引入Arm机密计算体系结构(Confidential Compute Architecture, CCA)来重新设计安全应用程序的工作方式。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。    


邹伟进一步解释道,Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,是存储数据和执行代码的动态安全区域,与操作系统或管理程序的特权模式分离,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。Arm机密计算体系结构建立在Arm的TrustZone技术之上,是软件容器的硬件版本,允许应用程序轻松地在不同的系统上运行。例如在非安全区的运行的应用程序可以动态申请机密领域,以保护自己的算法或数据。

 

 image.png?imageView2/2/w/550


“Arm还与合作伙伴共同开发平台安全架构PSA,作为一套标准的威胁模型、措施及时间,提供给终端设计人员使用,它与分级认证相结合后可以让此设备的采购者对资产的安全性更放心。例如在国内我们便和中国信息通信研究院泰尔实验室等联合,以支持基于PSA框架的安全物联网解决方案大规模部署。” 邹伟补充道。


打造新计算时代的大计算平台


除了安全性之外,机器学习也被视为Armv9的重要组成部分,因为在未来几年中越来越多的机器学习工作负载将变得司空见惯,在机器学习方面Armv9架构支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习;可伸缩矢量扩展2(SVE2)的引入,则能够更好地帮助开发者对高阶的应用场景进行开发,在处理 5G、虚拟现实和增强现实以及图像和语音识别等任务负载时具有很大增益。


放眼瞬息万变的数字世界,智能终端不仅需要具备灵活性强、功耗低的特点,同时还要满足AI/ML的工作负载需求,这些挑战正推动更安全和专用处理的发展,也是打开新市场、抓住新机遇的关键。Armv9架构的发布与全面计算解决方案以安全技术作为基础,将解锁整个生态系统的新体验,为未来十年构建可信的数字化服务。


 image.png?imageView2/2/w/550


邹伟总结到:“新一代Armv9架构将赋能开发者通过弥合软硬件之间的关键差距,构建和编程未来的可信计算平台,帮助我们的合作伙伴在更快的上市时间和成本控制之间取得平衡。安谋中国则致力于从技术到生态全面推动算力革命,并将在自研架构上加大投入,持续携手生态合作伙伴,依托领先的Arm全球生态深入做强本土研发,持续赋能本土产业创新的企业战略。” 


推荐阅读

史海拾趣

Econais公司的发展小趣事

自成立以来,Econais一直致力于技术创新。XXXX年,公司成功推出了一款具有里程碑意义的单芯片IEEE802.11b/g/n Wi-Fi系统级封装(SiP)模块——EC19D01。这款模块在业界引起了广泛关注,因为它不仅体积小、易于集成,而且待机功耗极低。这一突破性的创新使得Econais在物联网领域树立了技术领先的地位。

BAE Systems公司的发展小趣事

BAE Systems公司一直致力于技术创新,不断推动电子行业的发展。公司投入大量资源进行研发,开发出了一系列先进的电子系统和产品。这些技术成果不仅提升了公司的竞争力,也为全球电子行业的技术进步做出了贡献。例如,公司在军事通信、雷达系统、导弹技术等领域都取得了重要的突破,为国家的安全和防御提供了强有力的支持。

Gould Fiber Optics公司的发展小趣事
根据实验需求选择合适的电源电路类型,如线性电源、开关电源等。线性电源输出稳定但效率低,适用于对纹波要求高的场合;开关电源效率高但纹波较大,适用于对效率要求高的场合。
ARCOLECTRICSWITCHES公司的发展小趣事

在市场竞争日益激烈的情况下,ARCOLECTRIC SWITCHES公司始终坚持质量至上的原则。公司建立了完善的质量管理体系,从原材料采购到生产加工、产品检验等各个环节都严格把关,确保产品质量符合客户要求。同时,公司不断创新升级产品,推出更加智能化、节能环保的新型开关产品,满足市场不断变化的需求。

Don Connex Electronics Co Ltd公司的发展小趣事

随着国内市场的逐渐饱和,Don Connex Electronics开始寻求海外市场的拓展。公司组建了一支专业的国际市场团队,积极参加国际电子展会,与国际客户建立联系。通过不断努力,公司成功打入欧洲和北美市场,并与多家国际知名企业建立了长期合作关系。这一举措不仅提升了公司的品牌影响力,也极大地促进了公司的销售业绩。

Corporation Soneet公司的发展小趣事

随着Soneet在技术领域取得的成功,公司开始积极拓展市场。Soneet与多家知名电子设备制造商建立了战略合作关系,共同开发新产品。通过与这些合作伙伴的紧密合作,Soneet的产品得以迅速进入全球市场,进一步提升了公司的知名度和影响力。

问答坊 | AI 解惑

FPGA器件的在线配置方法

摘要: 介绍基于SRAM LUT结构的FPGA器件的上电配置方式;着重介绍采用计算机串口下载配置数据的方法和AT89C2051单片机、串行EEPROM组成的串行配置系统的设计方法及实现多任务电路结构中配置的方法,并从系统的复杂度、可靠性和经济性等方面进行比较 ...…

查看全部问答>

别傻了(1):必要时可以和老板争一争

看到一些职场的小警示,感觉很不错,和大家分享一下。题目是我起的,意思就是让大家别以为有些规则可以违背,虽然公司的员工手册上讲得天花乱坠。                     &nb ...…

查看全部问答>

谁有XDS100仿真器的驱动程序?

谁有XDS100仿真器的驱动程序?…

查看全部问答>

c51能实现64位的浮点运算吗?float 32位的误差太大了!

在单片机上做计算器的功能,需要比较高的精度,用float他只能支持到7位精度,超过7位的都给我四舍五入了,带来的误差实在太大了!我想用double双精度但sizeof发现他也是4个byte的和float一个样,难道c51单片机就没办法实现64位的双精度浮点运算? ...…

查看全部问答>

德州仪器新型LED驱动芯片瞄准大屏幕彩显领域

想知道TI在LED领域的新产品吗?快来看啧个哦~…

查看全部问答>

电容式触摸按键资料分享

近年来,触摸技术正在迅速向不同的市场领域渗透。尽管触摸技术类型迥异,但与其他技术相比,用于按键应用和屏幕应用的电容式触摸增长和渗透最快。其主要原因就在于,采用触摸按键不仅可以改善美学和工业设计,还能够提升可靠性,因为电容式触摸按键 ...…

查看全部问答>

请教:MSP430F5438A并口仿真器的使用问题

本人新学MSP430,用的是并口仿真器,按网上所说并口模式改为EPP+ECP,并将Debugger-》Driver设置成Fet-Debugger,Fet debugger ->setup设置为LPT-IF,但是没有办法下载程序,总是报错: Fatal error: Failed to initialize.  Check if h ...…

查看全部问答>

材料常数B值的问题

请教大家,材料常数B值的允许偏差ΔB/B是什么意思?…

查看全部问答>

430开发板板级支持包BSP430

MSPGCC的维护者Peter(pabigot) 最近完成了MSP430板级支持包的发布, 一般BSP都是一些比较高端或者复杂些的板子才会有,MSP430板级支持包的发布, 说明430的开发环境越来越成熟,越来越丰富了。 既来之则用之,哈哈! 目前主要支持MSP430的官方 ...…

查看全部问答>

关于嵌入式Linux系统flash分区设计及文件系统格式选择的一些浅见

嵌入式系统应用程序升级是比较频繁的,这就需要将flash进行合理的划分,一般情况,flash 的基本分区都有这几部分:1.uboot分区2.kernel分区3.rootfs分区这三部分是最基本的,一般都有。如果只是这样分区,然后应用程序和文件系统放在一起,这样的话 ...…

查看全部问答>