历史上的今天
返回首页

历史上的今天

今天是:2025年05月17日(星期六)

2019年05月17日 | 同一块硅片居然能放40个GPU?一起了解下硅互连结构

2019-05-17 来源:悦智网

早在20世纪80年代,并行信息处理技术先驱吉恩阿姆达尔(Gene Amdahl)就提出了一个提升大型机计算速度的计划:制造一种硅晶片大小的处理器。通过将大部分数据移动保留在处理器内部进行,计算速度可以更快,并且更节能。阿姆达尔拿到了当时数额最大的一笔风险投资,投资额是2.3亿美元。之后,他创办了Trilogy System公司,期望将他的愿景变为现实。可惜首次“晶圆级集成”的商业尝试很失败,导致“跳火坑”成为了一个金融新闻词汇。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的工程师们认为,现在是时候再尝试一次了。

 

在2月举行的IEEE高性能计算机体系结构国际研讨会上,伊利诺伊的电子与计算机工程副教授拉科什库玛(Rakesh Kumar)及其合作者阐述了有关包含多达40个GPU的晶圆级计算机的思路。这个多处理器“怪物”将计算速度提高了约19倍,而且能耗和信号延迟降低到了原来的1/140以下。

 

库玛表示:“计算单元之间的通信开销是我们想要解决的一个大问题。”超级计算机中的应用程序一般分布在数百个GPU中,这些GPU位于不同的印刷电路板上,并通过长数据链路进行通信。与芯片内部的互连相比,这些链路耗能更多而且速度较慢。此外,由于芯片和印刷电路板的机械特性不同,必须对处理器进行封装,而且要严格限制芯片可使用的输入和输出数量,因此,将数据从一个GPU转移到另一个GPU的“开销惊人”,库玛说。

 

image.png?imageView2/2/w/550

因此,需要让GPU模块之间互相连接,这些连接要与芯片内的互连一样快,一样丰富,能耗一样低。这种快速连接能够将这40个GPU集成到一起,成为一个巨型GPU。从程序员的角度来看,“整体就像一个GPU。”库玛说。

 

一种解决方案是使用标准的芯片制造技术,在同一块硅片上构建这40个GPU,然后在它们之间添加互连,但正是这种思路导致阿姆达尔在20世纪80年代的尝试失败。芯片越大,出现缺陷的可能性也越大。如果芯片与餐盘一样大,那么几乎可以保证,它上面总会有一个可使系统崩溃的缺陷。

 

更合理的方法是,从已经通过质量测试的普通尺寸的GPU芯片着手,寻找一种能够更好地连接它们的技术。该团队相信他们的硅互连结构(Si-IF)技术可实现这种方式。Si-IF技术用硅代替了电路板,不存在芯片与电路板之间的机械特性不符问题,也就不需要芯片封装。Si-IF晶圆上有一层或多层宽2微米、间距仅有4微米的铜线互连,这相当于芯片上最高级别的互连。在要插入GPU的地方,硅片上有间距约为5微米的短铜柱。将要插入的GPU对齐插入,然后加热即可。这种工艺已经很成熟,称为热压接合,能将铜柱熔接到GPU的铜互连线。伊利诺伊大学厄巴纳-香槟分校和加州大学洛杉矶分校的研究人员表示,由于互连线较窄且间距紧密,一块芯片上的输入和输出引脚数量最少可以提高到原来的25倍。

 

在设计晶圆级GPU时,库玛和他的同事不得不考虑许多限制因素,包括可以从晶圆上移除多少热量、GPU间怎样能够最快速地相互通信,以及如何为整个晶圆供电。

 

供电是其中一个较大的限制因素。使用标准的1伏芯片电源,Si-IF晶圆的布线将消耗整整2千瓦功率。因此,库玛的团队将供电电压提高到了48伏,降低了所需电流,从而减少了电能损失。这种方法需要在晶圆周围安置电压调节器和信号调理电容器,因此会占用原本可以用于更多GPU模块的空间。

 

尽管如此,他们还是在一个设计中塞进了41个GPU。通过对这种设计进行模拟测试,他们发现它比40台标准GPU服务器消耗的能量更少,数据计算和移动速度更快。

 

Si-IF晶圆级GPU“克服了早期晶圆级设计无法解决的问题”,位于加州圣何塞的Horst技术咨询公司的罗伯特W.霍斯特(Robert W. Horst)说。20多年前,在天腾电脑公司(Tandem Computer)工作的霍斯特参与开发了唯一商业化的晶圆级产品——在证券交易所取代高速硬盘的存储系统。他预计,散热将是晶圆级芯片开发中最具挑战性的问题之一。“在这么狭小的空间内加入这么密集的逻辑,功耗可能会相当高。”他说。

 

库玛表示,该团队已经开始着手构建一个晶圆级原型处理器系统,但并未披露更多细节。

 


推荐阅读

史海拾趣

BROTHER公司的发展小趣事

在电子行业的发展过程中,技术创新始终是BROTHER公司的重要驱动力。公司注重研发投入,拥有一支高素质的研发团队,不断推出具有创新性和竞争力的新产品。同时,BROTHER还积极与高校、科研机构等合作,开展产学研合作,推动技术创新和产业升级。通过技术创新,BROTHER不仅提升了产品质量和性能,还降低了生产成本,提高了市场竞争力。

Alcatel-Lucent公司的发展小趣事

BROTHER公司的历史可以追溯到1908年,当时安井兼吉在名古屋市开设了工业缝纫机维修及零部件生产的“安井缝纫机商会”。随着时间的推移,公司逐渐发展成为缝纫机领域的领导者。然而,BROTHER并没有满足于在缝纫机领域的成功,而是开始寻求跨界发展的机会。上世纪中叶,随着电子技术的兴起,BROTHER开始利用其在机械制造和精密加工方面的技术优势,涉足电子产品领域。通过不断研发和创新,BROTHER成功推出了一系列电子产品,逐渐在电子行业崭露头角。

Gigavac LLC公司的发展小趣事

在电子行业的发展过程中,技术创新始终是BROTHER公司的重要驱动力。公司注重研发投入,拥有一支高素质的研发团队,不断推出具有创新性和竞争力的新产品。同时,BROTHER还积极与高校、科研机构等合作,开展产学研合作,推动技术创新和产业升级。通过技术创新,BROTHER不仅提升了产品质量和性能,还降低了生产成本,提高了市场竞争力。

EMC Technology RF Labs公司的发展小趣事

在追求经济效益的同时,RF Labs也注重可持续发展和环保责任。他们积极采用环保材料和绿色生产工艺,降低生产过程中的能耗和排放。同时,RF Labs还积极参与环保公益活动,推动电子行业的绿色发展。这些举措不仅体现了RF Labs的社会责任感,也为公司的长期发展奠定了坚实的基础。

法思特(FAST)公司的发展小趣事
随着使用环境和需求的变化,可能需要对控制电路进行调整和优化,以适应新的使用条件。
台湾兆欣(EMTEK)公司的发展小趣事

兆欣深知品质和服务对于企业发展的重要性。他们始终坚持高品质的生产标准,确保每一件产品都符合客户的期望。同时,兆欣还提供了周到的售前咨询和售后服务,为客户提供了全方位的支持。这种以客户为中心的经营理念赢得了客户的广泛赞誉和信任。

问答坊 | AI 解惑

【技术白皮书】自举电路在HVIC中的运用和参数设计

Bootstrap Network Analysis: Focusing on the Integrated Bootstrap Functionality…

查看全部问答>

EVC中多个定时函数的问题

SetTime(1,1000,NULL); SetTime(2,2000,NULL); 请问如何当第一个定时器时间到时第二个定时器开始定时,第二个定时器时间到时第一个定时器开始定时,如此循环下去 谢谢各位…

查看全部问答>

招聘Wince开发人员,应用,BSP

有梦想就有希望,地点深圳,待遇优。企业实力强! 有意发邮件到pz_forever@126.com…

查看全部问答>

急!调试A4的LCD遇到的问题

大家好,现在我在调试A4(ARM11)的LCD驱动遇到一些问题不知道如何去解决,请指点一二。 1 在调节背光时,一点屏,屏的亮度会变化。 2 在背光低时,如果功率过大,频闪的厉害。 3 LCD显示,感觉有左右拉伸,比如在开机LOGO画面,下面部分,向右 ...…

查看全部问答>

(高价)(高价)(高价)诚激高手开发:sock5全自动代理自助管理系统,有技术者加QQ详谈,99040008

(高价)(高价)(高价)诚激高手开发:sock5全自动代理自助管理系统,有技术者加QQ详谈,99040008…

查看全部问答>

dsp原理与应用技术课件

对初学者很有用处啊,希望不会让大家失望…

查看全部问答>

workbench中定义Remote systems,为什么没有vxworks6.x?

workbench教程中 Click the Define a connection to remote system icon in the Remote Systemsview toolbar.之后出现如图   但是我的IDE中…

查看全部问答>

关于输入捕获

我打算用TIM2的输入捕获功能计算波形的频率和占空比,我感觉应该是不管我是上升沿触发还是下降沿触发,得到的计数值应该是一样的吧,怎么实际上不一样呢,如果用上升沿触发,计算出的频率和我输入的频率差不多。…

查看全部问答>