历史上的今天
返回首页

历史上的今天

今天是:2025年02月18日(星期二)

正在发生

2021年02月18日 | IBM研制出新款AI芯片,利用效率更高

2021-02-18 来源:半导体行业观察

IBM声称已开发出世界上第一批采用7纳米技术构建的用于AI推理和训练的高能效芯片。在2月初举行的2021年国际固态电路虚拟会议上,该公司的研究人员详细介绍了一种硬件加速器,该加速器支持多种模型类型,同时在所有模型类型上实现“领先”的电源效率。

 

AI加速器是一种专用硬件,旨在加速AI应用程序,特别是神经网络,深度学习和机器学习。它们在设计上是多核的,并且专注于低精度算术或内存计算,这两者都可以提高大型AI算法的性能,并带来更好的自然语言处理,计算机视觉和其他处理。

 

IBM表示,其四核的芯片(仍处于研究阶段)已针对具有许多不同的AI和机器学习模型的低精度工作负载进行了优化。与高精度技术相比,低精度技术需要更少的硅面积和功耗,从而提高了缓存利用率,并减少了内存瓶颈。这通常会减少训练AI模型的时间和精力成本。 

                                              image.png?imageView2/2/w/550

上图:IBM建议的AI芯片的示意图。图片来源:IBM

 

IBM的AI加速器芯片是少数采用超低精度“混合FP8 ”格式并以基于极端紫外线光刻的封装来训练深度学习模型的芯片。它也是率先采用电源管理的功能之一,能够通过在高功耗的计算阶段放慢速度来最大化性能。它提供了很高的持续利用率,表面上可以转化为卓越的实际应用性能。

 

据了解,这颗芯片用于用于“混合” FP8训练的时候,具有25.6Tflop / s的速度,而用于INT4推理,也可以做到102.4Top / s的速度。

 

混合8位浮点(HFP8)是IBM发明的一种格式(于2019年发布),它克服了标准8位(1个符号,5个指数,2个尾数)FP8浮点格式的局限性,在训练特定的8位浮点格式时效果很好标准神经网络,但在训练其他网络时会导致准确性降低。混合FP8使用4个指数和3个尾数位进行正向传播,然后使用5个指数和2个尾数位进行逆向传播,这大大提高了训练的准确性。

 

四个核通过一对宽的快速数据环链接在一起,一个用于顺时针传输,另一个用于逆时针传输。这些可以保持在芯片内关闭,也可以通过外部存储器或多个相同的芯片打开并路由,以处理更大的网络。环和内核是异步的,以允许不同的时钟速率分别交换功率以提高性能。

 

每个核心分为两个共享暂存存储器的子核心,然后每个子核心具有8×8引擎阵列,这些引擎经过优化,可通过用于浮点和定点计算的单独管道来加速卷积和矩阵乘法–一起提供FP16,HFP8,INT4和INT2具有AI训练和推理功能。

 

该36mm 2 芯片采用EUV光刻技术制造,通过内核上的0.75V和SRAM上的0.95V达到了上述性能指标。利用在编译网络时收集的网络知识,该芯片可以限制耗电的网络层,以将其保持在功耗预算之内。标称工作频率(0.55V内核,0.7V SRAM)产生1GHz时钟,并具有3.5Tflop / s / W FP8和16Top / s / W INT4。

 

在实验中,IBM表示,其AI芯片通常可达到80%以上的训练利用率和60%以上的推理利用率。此外,该芯片的性能和功率效率超过了其他专用推理和训练芯片。

 

image.png?imageView2/2/w/550

IBM研究的基准结果。图片来源:IBM

 

IBM未来2-3年的目标是将新颖的AI芯片设计商业应用到一系列应用中,包括在云,隐私,安全性和自动驾驶汽车方面的大规模训练。IBM研究人员Ankur Agrawal和Kailash Gopalakrishnan在博客中写道:“我们的新AI核心和芯片可用于跨多个行业的许多新的云到边缘应用程序。” “例如,它们可以用于使用8位格式(相对于当前行业中使用的16位和32位格式)的视觉,语音和自然语言处理中的大规模深度学习模型的云训练。它们还可以用于云推理应用程序,例如语音到文本AI服务,文本到语音AI服务,自然语言处理服务。

IBM
推荐阅读

史海拾趣

芯邦(Chipsbank)公司的发展小趣事

在全球半导体市场竞争日益激烈的背景下,芯邦科技面临着来自国际巨头的挑战。然而,公司凭借在半导体设计领域的深厚积累和不断创新的精神,逐步形成了自己的核心竞争力。同时,芯邦也积极寻求与国际合作伙伴的合作机会,共同推动半导体产业的发展。

以上五个故事简要概述了芯邦科技在电子行业中的发展起来的关键节点和里程碑事件。这些故事不仅展现了芯邦科技在技术创新、产品线拓展、资本运作、市场表现和国际竞争等方面的努力和成就,也预示着公司未来发展的广阔前景和无限可能。

Burr-Brown公司的发展小趣事

2000年,Burr-Brown被著名的美国德州仪器公司(Texas Instruments)收购,成为其高性能模拟器件部门的一部分。这一收购为Burr-Brown提供了更强大的资源和支持,使其能够继续专注于模拟器件(如ADC、DAC等)的生产和创新。在德州仪器的引领下,Burr-Brown持续保持技术领先,为全球电子行业的发展做出了重要贡献。

这五个故事共同展现了Burr-Brown公司从创立到发展壮大的历程,以及其在电子行业中的卓越成就和持续创新的精神。通过不断适应市场变化和技术进步,Burr-Brown成功地在竞争激烈的电子行业中脱颖而出,成为一家备受尊敬的企业。

DAQ Electronics LLC公司的发展小趣事

在DAQ Electronics LLC公司的发展历程中,质量一直是其坚守的核心原则。公司建立了严格的质量控制体系,从原材料采购到产品生产、检测、包装等各个环节都进行严格把控。这种对质量的坚持,使得DAQ Electronics LLC公司的产品在市场上获得了良好的口碑和信誉。客户对公司的产品和服务给予了高度评价,也为公司的持续发展提供了有力保障。

DETCO公司的发展小趣事

随着智能家居市场的兴起,ElectronicsCorp看到了巨大的潜力。公司投入大量资金研发智能家居设备和技术,并与多家知名家居品牌合作推出了一系列智能家居解决方案。这些解决方案不仅提供了便捷的智能家居体验,还注重用户隐私保护和数据安全。通过不断创新和优化产品体验,ElectronicsCorp在智能家居领域取得了显著突破,并成为全球智能家居市场的领军企业之一。

APLUS Products公司的发展小趣事

在XXXX年,APLUS Products公司迎来了一次重要的技术突破。公司研发团队成功开发出了一款具有划时代意义的电子产品,该产品在性能、稳定性和用户体验等方面均达到了行业领先水平。这一技术突破不仅为公司赢得了大量订单,还进一步巩固了其在电子行业中的市场地位。

Cynergy 3公司的发展小趣事

Cynergy 3公司最初以生产干簧开关起家,位于英国多塞特郡的工厂见证了公司从一个小型制造商到全球领先者的蜕变。通过不断创新和改进,Cynergy 3的干簧继电器产品逐渐获得了市场的认可。公司注重产品质量和可靠性,确保每一个出厂的产品都能达到最高的标准。这种对质量的坚持使得Cynergy 3在竞争激烈的电子行业中脱颖而出。

问答坊 | AI 解惑

LM567通用音调译码器集成电路的应用

LM567通用音调译码器集成电路的应用 资料来源:http://www.qlmcu.com/567为通用音调译码器,当输入信号于通带内时提供饱和晶体管对地开关,电路由I与Q检波器构成,由电压控制振荡器驱动振荡器确定译码器中心频率。用外接元件独立设定中心频率带 ...…

查看全部问答>

步进系统的运行精度

  从步进电机的角度来说,需要满足一些公差标准,包括机械公差和电气公差。相绕组电感的不均衡是重要因素,其他一些原因包括极靴、转子的不对准,定转子间气隙的不均匀,定转子齿槽关系,以及转矩脉动等。达到并持续控制这些参数并不是非常困难的 ...…

查看全部问答>

【博客帮助帖】群组功能的使用

1)登录博客后,进入个人空间首页,点击左侧的“群组”,如下图所示: 2)进入群组管理界面,在这里可以查看自己加入的群组,热门的群组,群组话题等等,还可以创建群组,发起新话题。 …

查看全部问答>

要做医用雾化器的传感器测量传到单片机ADUC812

要做一个医用雾化器的控制系统. 目前还有传感器这个地方不了解.希望得到各位大神的帮助. 要测量的正常工作电压是86kPa~106 kPa.放到单片机ADUC812进行控制 [ 本帖最后由 hch1129 于 2010-3-24 10:59 编辑 ]…

查看全部问答>

向gooogleman求救!

    我有一个多普达828的主板,系统是WM6.1 CPU是PXA272 ROM是128M RAM是64M,手机\\PDA功能都正常.这个主板有三个UART,其中一个STUART应该接红外端口用来进行红外数据传输.我把红外的驱动卸载了(也就是把驱动用的DLL改了名)然后,对这个RXD ...…

查看全部问答>

针对Altera FPGA和CPLD的电源管理,TI解决方案

TI电源解决方案支持Altera FPGA及CPLD,包括Stratix, Cyclone, Arria, Arria II, HardCopy and MAX II 器件。…

查看全部问答>

关于TMS320F28335片上内存的问题

       最近在用TMS320F28335做项目,编写程序时一直都将程序以及数据分配到0x8000~0xFFFF(SARAM)片区,以往的调试过程中也没遇到什么问题,但是由于这次编写的程序量比较大,这个片区已经存放不下了,因此,前两 ...…

查看全部问答>

CODE_SECTION pragma

The CODE_SECTION pragma allocates space for the func in a section named section name. The CODE_SECTION pragma is useful if you have code objects that you want to link into an area separate from the .text section.The syntax of the ...…

查看全部问答>

求懂cc2530的大神们帮忙

要设计一个基于cc2530的可以实现HC-SR04超声波测距,1602显示测距结果的电路,用这三者直接接线能实现么,会程序的求给个程序,本人菜鸟一个,求大神详细解说一下…

查看全部问答>

恒压整流滤波器

搞认证谐波电流不过。230V AC输入,通过KBP610全波整流,然后LC无源滤波,输出的直流电压是不是300V DC左右? 因为负载需要的是230V DC的直流,怎么办? …

查看全部问答>