历史上的今天
返回首页

历史上的今天

今天是:2025年03月31日(星期一)

正在发生

2021年03月31日 | Arm推出新一代指令集架构Armv9,整体性能跃升一级

2021-03-31 来源:网络整理

Arm推出新一代指令集架构Armv9,以越来越强大的安全性和人工智能能力,应对无处不在的专业处理需求,这是Arm十年来最大的技术革新,上一代的Armv8发布于2011年10月。Arm表示,Armv9架构将在安全性和人工智能方面与英特尔相抗衡。

 

基于Arm架构的芯片出货量持续增长,过去五年出货超过1000亿颗。按照这个增长速度,全球100%的共享数据将很快在Arm芯片上进行处理,包括端点,数据网络或云中。随着AI,物联网和5G在全球范围内蓬勃发展,Armv9中的新功能将加速在每个应用程序中从通用计算向更专业的计算转变。

 

Arm首席执行官Simon Segars表示,Armv9在基于通用计算的经济性,设计自由度和可访问性的基础上,对普遍的专业/安全和强大的处理需求的推动下,它将在接下来的3000亿个基于Arm架构的芯片中处于最前沿。

 

据悉,Armv9可以动态建立Realms(领域),以保护重要数据和代码不受系统其余部分的影响。Armv9将包括SVE2(类似于英特尔的AVX指令集),以协助机器学习和数字信号处理任务。

 

Arm承诺将在Armv9基础上提高整体性能,预计在接下来的两代移动和基础架构CPU中,CPU性能将提高30%以上,而硬、软件改善将进一步提高性能。Arm强调,所有现有软件都可以在基于Armv9的处理器上运行,而不会出现任何问题。但是,随着行业从通用计算向普遍存在的专用处理转变,每年两位数的CPU性能提升还远远不够。除了增强专业处理能力外,Arm的Total Compute设计方法还将通过针对性的系统级硬件和软件优化以及用例(use-case)性能的提高来加快总体计算性能。

 

Arm还表示,Armv9将为图像和语音识别等任务增加人工智能芯片的功能,在该领域,英伟达公司的芯片表现已经超过了英特尔,并帮助其市值超过了英特尔。

 

对于与英伟达的合并案,Simon Segars强调,“我们对与英伟达合并未来感到振奋,将我们无处不在的计算平台与他们深厚的人工智能专业知识结合在一起,将带来更强的工程能力。 ”

 

Arm预计,第一批基于Armv9的处理器将在今年年底之前上市。

 

与Armv8 区别:延续 AArch64 基准指令集 ,全面性能提升,还有重要扩展

 

安全性升级对于 Armv9 来说,其重要性相当于 64 位对于 Armv8。

 

 

自 2011 年 10 月 Arm 首次公布 Armv8 架构以来,已经有近 10 年的时间了,这是计算领域相当多变的 10 年,因为指令集架构通过移动领域到服务器领域的应用越来越多,现在开始在笔记本电脑和即将到来的台式机等消费设备市场上普及。这些年来,Arm 对 ISA 进行了各种更新和扩展,有些是重要的,有些也许很容易被忽略。

 

全新的 Armv9 架构,为 Arm 希望在未来十年成为下一代 3000 亿颗芯片的计算平台奠定基础。

 

 

Armv9 与 Armv8 到底有什么区别,才会在 ISA 的命名上有如此大的跳跃?

 

外媒分析称,说实话,单纯从 ISA 的角度来看,v9 可能并不像 v8 相比 v7 那样有根本性的跳跃,v8 曾用 AArch64 引入了完全不同的执行模式和指令集,而 AArch64 比 AArch32 有更大的微观架构影响,比如扩展寄存器、64 位虚拟地址空间等许多改进。

 

Armv9 延续了 AArch64 作为基准指令集的使用,然而在功能上增加了一些非常重要的扩展,值得在架构编号上做一个增量,可能让 Arm 也实现了一种软件的重新垒砌,不仅是新的 v9 功能,也包括我们这些年看到的各种 v8 扩展的发布。

 

IT之家获悉,Armv9 拥有三大新支柱,Arm 认为新架构的主要目标是:安全、AI 以及改进矢量和 DSP 能力。安全性是 v9 的一个非常大的话题,值得更深入地介绍新的扩展和功能细节,但谈到 DSP 和 AI 功能,可以是很直接的。

 

 

承诺与 Armv9 兼容的新 CPU 最大的新特性可能是开发者和用户马上就能看到的,那就是 SVE2 作为 NEON 的后续产品的基线。

 

可伸缩矢量扩展,也就是 SVE,在第一次实现的时候,早在 2016 年就宣布了,并首次在富士通的 A64FX CPU 核心中实现,现在日本的世界第一超级计算机 Fukagu 就采用了 SVE。SVE 的问题在于,这个新的可变向量长度 SIMD 指令集的首次迭代范围相当有限,而且更多的是针对 HPC 工作负载,缺少了许多通用性较强的指令,而这些指令仍然被 NEON 所覆盖。

 

SVE2 早在 2019 年 4 月就公布了,希望通过补充新的可扩展 SIMD 指令集所需的指令来解决这个问题,以服务于目前仍在使用 NEON(指 128 位 SIMD 单指令多数据扩展结构)的更多样的 DSP 类工作负载。

 

SVE 和 SVE2 除了增加各种现代 SIMD(单指令多数据)能力之外,好处在于它们的可变向量大小,从 128b 到 2048b 不等,允许可变 128b 粒度的向量,而不管实际硬件运行在什么地方。纯粹从矢量处理和编程的角度来看,这意味着软件开发者只需要编译一次代码,如果未来 CPU 会出现比如原生 512b 的 SIMD 执行流水线,代码就已经可以利用单位的全部宽度了。另外,同样的代码也能在更保守的设计上运行,并具有更低的硬件执行宽度能力,这对 Arm 公司来说非常重要,因为他们设计了从物联网、移动设备到数据中心的 CPU。此外,它还能在 Arm 架构的 32b 编码空间内完成所有这些工作,而在 x86 上的其他实现则必须根据向量大小增加新的扩展和指令。

 

 

机器学习也被视为 Armv9 的一个重要部分,因为 Arm 看到未来几年越来越多的 ML 工作负载将变得普遍。在专用加速器上运行 ML 工作负载自然仍然是性能或能效关键的要求,然而,仍然会有大量新的较小范围的 ML 工作负载采用,这些工作负载将在 CPU 上运行。

 

矩阵乘法指令是这里的关键,并将代表着在整个生态系统中看到更大规模采用的重要一步,作为 v9 CPU 的基线功能。

 

一般来说,SVE2 可能是保证跳转到 v9 命名法的最重要因素,因为它是一个更明确的 ISA 功能,在日常使用中区别于 v8 CPU,这将保证软件生态系统去实际分化现有的 v8 堆栈。这其实已经成为 Arm 在服务器领域的一个相当大的问题,因为软件生态系统仍然是以 v8.0 为基础的软件包,可惜缺少了最重要的 v8.1 大系统扩展。

 

让整个软件生态系统向前发展,并且能够假设新的 v9 硬件具有新架构扩展的能力,这将有助于推动事情的发展,可能会解决目前的一些情况。

 

然而 v9 不仅仅是 SVE2 和新的指令,它还有一个非常大的重点就是安全,在这里我们会看到一些比较彻底的变化。

 

新的 Arm 保密计算架构 (CCA)试图通过基于硬件的安全环境保护敏感数据。这些所谓的 “领域”可以动态创建,以保护重要数据和代码不受系统其余部分的影响。

 

除了这些更具体的改进外,Arm 还承诺在 Armv9 基础上进行更全面的性能提升。该公司预计,在未来两次迭代中,CPU 性能将提高 30% 以上,并通过软件和硬件优化进一步提升性能。Arm 表示,所有现有软件都可以在基于 Armv9 的处理器上运行,没有任何问题。

 

Arm
推荐阅读

史海拾趣

Dytran Instruments Inc公司的发展小趣事

作为一家技术驱动型企业,Dytran始终将技术创新作为公司的核心竞争力。公司不断投入研发资源,推动传感器技术的升级和产业升级。在单轴和三轴IEPE加速度计、超高温充电模式传感器、高冲击传感器、电容式MEMS传感器等领域,Dytran都取得了显著的技术突破。这些新技术不仅提高了传感器的性能和精度,还拓展了其应用领域和市场空间。

同时,Dytran还注重与其他行业的合作与交流。通过与航空航天、汽车等行业的合作,Dytran将传感器技术应用于更多领域,推动了相关产业的发展。此外,公司还积极参与国际标准的制定和推广工作,为传感器技术的国际化和标准化做出了贡献。

Design Gateway公司的发展小趣事

1985年,泰德·维特(Ted Waitt)和Mike Hammond两位年轻人决定辍学创业。他们利用维特祖母的15,000美元存款作为担保,从银行获得了10,000美元贷款,租用了一台计算机,并准备了一份三页的经营计划。在维特父亲位于爱荷华州苏城的牧场里,他们创办了TIPC Network公司(Gateway的前身)。公司起步时,主要向得克萨斯电脑器械公司销售零配件,并开展计算机邮购业务。得益于直销商业模式,Gateway在短短四个月内就实现了10万美元的销售额。

德尔创(Dersonic)公司的发展小趣事

在激烈的市场竞争中,德尔创始终保持着对技术创新的追求。公司不断加大研发投入,引进高端人才和先进设备,积极探索新的技术路线和产品应用。通过多年的积累和创新,德尔创在电子元器件领域已经拥有了一批具有自主知识产权的核心技术,并在市场上取得了显著的优势。这些技术优势不仅提升了公司的竞争力,还为公司的未来发展奠定了坚实的基础。

亿佰特(EBYTE)公司的发展小趣事

亿佰特注重团队建设和人才培养。公司吸引了一批具有丰富经验和专业技能的人才加入,形成了一支高效、专业的团队。公司还注重员工的培训和发展,为员工提供广阔的晋升空间和职业发展机会。正是这支优秀的团队,为亿佰特的发展提供了源源不断的动力。

骏晔科技(DreamLNK)公司的发展小趣事

物联网设备的互操作性一直是行业内的挑战。骏晔科技在面对这一挑战时,积极寻求解决方案。公司通过与多家物联网系统提供商合作,共同推动物联网互操作性标准的制定和实施。同时,公司还针对不同类型的物联网设备,提供定制化的RF模块和解决方案,帮助客户实现设备的互联互通。

上海超致公司的发展小趣事

作为一家有社会责任感的企业,上海超致始终关注环境保护和可持续发展。公司积极推广绿色生产技术和资源循环利用方案,减少生产过程中的能源消耗和废弃物排放。同时,上海超致还积极参与社会公益活动,为社区和环境贡献自己的力量。这种对社会责任的关注和担当使得上海超致在电子行业中树立了良好的形象。

问答坊 | AI 解惑

关于发表话题回复话题时的系统故障

我们发表话题或者回复话题的时候。有事写很长,要很多时间。当好不容易打完了,然后点发表,这个时候会出现各种各样的错误(很正常而且几率很大。我试过基本十次有五六次都会错误),这个时候如果实现没保存那么辛辛苦苦打出来的东西就付诸东流,希 ...…

查看全部问答>

分频PLC程序梯形图

在许多控制场合,需要对信号进行分频。下面以如图5-16所示的二分频程序为例来说明PLC是如何来实现分频的。 图5-16 二分频程序 a)梯形图 b)时序图 图中,Y30产生的脉冲信号是X1脉冲信号的二分频。图5-16b中用了三个辅助继电器M160、M161和M16 ...…

查看全部问答>

编译多媒体程序时,报错:cannot open input file 'strmiids.lib'

  首先用PB定制了一个内核,并生成了相应的SDK,安装了SDK后,用EVC调试一个多媒体程序时总是报错:   LINK : fatal error LNK1181: cannot open input file \'strmiids.lib\'       请问:     ...…

查看全部问答>

请问WinCE下怎么实现禁用某项菜单

如题,用什么API函数可以实现这个功能啊?大家指点一下…

查看全部问答>

c语言数据类型运算的注意

       在C语言程序的表达式或变量赋值运算中,有时会出现运算对象的数据不一致的情况。C语言允许任何标准数据类型之间的隐式转换。所谓隐式转换是指系统会自动对相关数据类型进行转换,不需要强制干预。 隐式转换按以 ...…

查看全部问答>

Systick_config优先级设定的理解 NVIC_SetPriority

Systick模块初始化配置函数(Systick_config)中设定模块中断优先级的函数为: NVIC_SetPriority((SysTick_IRQn, (1<<__NVIC_PRIO_BITS) - 1);   参数SysTick_IRQn为systick基址,这个没什么好说的   关键在参数 (1<<__NVIC ...…

查看全部问答>

9B96的网口可否接光纤网

9B96的网口可否接光纤网啊?哪位大侠搞过啊?…

查看全部问答>

关于430的复位电路

整个板子只接了430和复位电路。 RST上10k到VCC没问题。仿真器能连上。 可是如果同时0.1uF到GND。仿真器就连不上了。。 试过270nF也一样。。这个是什么问题啊。 整个板子只接了430和复位电路。请指点。…

查看全部问答>

【ULP Advisor Rule Table】规则2.1利用定时器完成延时操作

很多时候我们偷懒采用CPU在那里空跑的方式来获得延时,下面看看有哪些延时语句 __no_operation(); _NOP();复制代码这是空操作语句,其实我认为少量的这样的语句是可以接受的volatile int i = MAX_VALUE; while (i-- > 0);复制代码这种是最常见的 ...…

查看全部问答>

学长给了我一块430的板子,比赛时发的,msp430fr5739,自带仿真器,怎么在IAR设置啊

怎么在IAR中设置相关的选项呢,仿真什么的,有没有相关资料呢,好像还是149的资料多…

查看全部问答>