历史上的今天
返回首页

历史上的今天

今天是:2024年11月13日(星期三)

正在发生

2020年11月13日 | 大内存让高性能计算更高效

2020-11-13 来源:EEWORLD

并不是每一个HPC在分析工作负载时都能很好地适应256GB甚至512 GB的内存空间,在数据集非常庞大的时候,用较大的内存空间运行会更好,而不是把它分割成小块,用相同数量的原始计算分散到各个节点上。

 

Lawrence Livermore国家实验室,拥有非常强大的超级计算机,他们也是HPC前500强的常客,他们正在建造一个叫做“猛犸”的内存密集型的计算机,这是由AMD、LLNL研究人员、Supermicro和Cornelis Networks合作设计的。特别值得注意的是,虽然这个集群已经有足够的运算处理能力,但它的重点是提供 "大内存 "计算能力。换句话说,它安装的内存比人们对典型的HPC集群的认知要大得多。

 

 

Lawrence Livermore宣布了这一庞大的系统已经运行了一段时间,它是基于高端64核版本的,搭载两颗AMD第二代“Rome”Epyc 7002处理器让它的表现更强劲,其中央处理器设计实现了一个中央输入输出集线器,所有芯片外的通信都通过该集线器进行。完整的设计使用了八个核心小芯片,称为核心复合芯片(CCDs),一个用于输入/输出的中心芯片,称为输入/输出芯片(IOD)。所有的CCD通过专用的高速无限光纤(IF)链路与这个中央I/O中心进行通信,通过这个核心可以与内部的DRAM和PCIe通道或其他核心进行通信,内存占用比英特尔的Xeon SP处理器更大,后者每插座最多只能有6个控制器。

 

 

根据Lawrence Livermore提供的信息,每个Mammoth节点都有一对AMD Epyc 7742处理器。这是这些芯片在2019年8月上市时,这也是英伟达为其DGX A100混合CPU-GPU系统选择的处理器。今年2月,AMD提升了Rome芯片的时钟速度,推出了64核版本Epyc 7H12,时钟频率为2.6 GHz,但功耗280瓦。Lawrence Livermore和Nvidia的Epyc 7742都选择了较慢的2.25 GHz,但功耗只有225瓦,成本仅为6950美元。节省下来的钱可以用来提高系统的主存容量。

 

更准确地说, 在重点的内存配置方面,Mammoth集群的每台服务器都装了2TB的DRAM和4TB的非易失性内存,因此可用的总内存是128TB的DRAM,以及256TB的NVRAM。这就是强调的"大内存"。相比之下,在一对2.6 GHz的18核“Cascade Lake”Xeon SP处理器上使用24个2.93 GHz的DDR4,Xeon SP处理器在STREAM Triad基准测试中提供大约140 GB/sec的记忆体带宽,但是当2.93 GHz的DDR4记忆体用于更高性能的部分时,这对英特尔芯片的记忆体带宽峰值为282 GB/sec。显然,AMD有很大的内存带宽优势。

 

就本地存储容量而言,每个Mammoth节点有3.84 TB的闪存,外加一个运行速度100 Gb/秒的全路径网络接口卡,该网络接口卡来自Cornelis Networks,后者最近从英特尔手中接管了全路径InfiniBand网络业务。每个节点都有4.6TOPS的峰值双精度性能。

 

Mammoth集群拥有一个全路径网络,运行速度为100 Gb/秒,采用FatTree胖树拓扑结构。这是对网络中机架顶部和聚合交换机之间有多少链路的度量,一般来说,只要分布式计算系统中的节点之间传输消息越少,那么链路越少,物理交换机越少,网络成本越低,对性能的影响就不会那么大。但是对于消息量大的话,锥形网络的有效带宽将低于完全供应的FatTree网络。

 

Mammoth拥有8192个内核,提供294 TOPS的峰值双精度性能,这是通过128TB的主存和245TB闪存来平衡的。据我们所知,内存共享是由消息传递接口(MPI)完成,并且没有像TidalScale或ScaleMP这样的附加层将内存组合成更大的聚合或单个共享内存空间。

 

据了解,Mammoth的高性能也在地域疫情期间出了不少力。

 

研究人员认为,Mammoth的特殊配置将提供它们所需的计算效率,这对数据密集型的COVID-19研究和大流行病响应等项目可以更好地去优化。它将同时用于 "基因组学分析、非传统的HPC模拟和图形分析,这些都是从事COVID-19研究的科学家们所需要的,包括抗病毒药物和设计抗体的开发。

 

研究人员已经通过Mammoth尝试分析SARS-CoV-2病毒的基因组,探究该病毒如何进化,并研究突变的可能性。参与该项目的科学家表示,这套系统可以将基因组分析所需的时间从几天减少到几个小时。这个新集群其中一个具有价值是,Rosetta Flex软件在其他HPC集群上的内存限制为每个节点12或16个同时计算,但Mammoth可以在一个节点上同时处理128次Rosetta Flex计算。

 

Lawrence Livermore并没有透露Mammoth的具体成本。


推荐阅读

史海拾趣

Fairview Microwave Inc公司的发展小趣事

在国内市场取得一定成绩后,Fairview Microwave开始将目光投向国际市场。他们积极参加国际电子展会和技术交流活动,与全球各地的客户建立联系。同时,公司还积极开拓海外市场,通过设立分支机构和代理商等方式,将产品销售到全球各地。这些举措不仅为公司带来了更多的商机,也进一步提升了Fairview Microwave的品牌知名度和影响力。

ALSC [Alliance Semiconductor Corporation]公司的发展小趣事

ALSC深知品质是企业的生命线。因此,公司建立了严格的质量管理体系,从原材料采购到产品出厂的每一个环节都进行严格把控。同时,公司还注重品牌建设,通过广告宣传、参加展会等方式提升品牌知名度和美誉度。这些举措使得ALSC在客户心中树立了良好的品牌形象。

芯茂微电子公司的发展小趣事

芯茂微电子始终坚持以创新驱动发展,不断投入研发资源,推动技术创新和产品升级。同时,公司积极寻求与国内外知名企业和研究机构的合作,共同开展技术研发和市场拓展。通过与合作伙伴的紧密合作,芯茂微电子在集成电路设计、制造工艺、封装测试等方面取得了重要进展,进一步提升了公司的核心竞争力和市场地位。

D3 Semiconductor公司的发展小趣事

在全球化的大背景下,D3 Semiconductor积极拓展国际市场。除了与贸泽电子的合作外,公司还与多家国际知名的电子企业建立了合作关系,将产品推向全球各地。同时,D3 Semiconductor还加强了在国际市场的营销和品牌建设,提高了公司的知名度和美誉度。这一系列的努力使D3 Semiconductor在国际市场上取得了显著的成绩,也为公司的未来发展奠定了坚实的基础。

Fairchild (ON Semiconductor)公司的发展小趣事

随着技术的不断进步和市场的不断扩大,Fairchild Semiconductor开始将目光投向全球市场。公司积极开拓海外市场,与全球各地的企业建立合作关系,共同推动半导体技术的发展。通过不断努力,Fairchild逐渐在全球半导体市场中占据了重要地位。

Aydin Corp公司的发展小趣事

Aydin Corp公司诞生于电子行业的初期,当时的市场充满了机遇与挑战。创始人凭借对电子技术的深厚理解和对市场需求的敏锐洞察,决定投身于这一领域。初创时期,公司面临着资金短缺、技术瓶颈和市场竞争等多重困难。然而,通过不懈的努力和持续的创新,Aydin Corp逐渐在市场中站稳了脚跟。

问答坊 | AI 解惑

单片机控制开关电源的程序!

单片机怎么控制开关电源啊…

查看全部问答>

广告灯

4. 广告灯的左移右移 1. 实验任务 做单一灯的左移右移,硬件电路如图4.4.1所示,八个发光二极管L1-L8分别接在单片机的P1.0-P1.7接口上,输出“0”时,发光二极管亮,开始时P1.0→P1.1→P1.2→P1.3→┅→P1.7→P1.6→┅→P1.0亮,重复循环。 ...…

查看全部问答>

摩托罗拉的MC9S08AC16的I/O口带负载能力是多少呀?

如题。 刚刚用这个东西,翻了规格书也不知道。 MC9S08AC16的I/O究竟可以驱动多大的电流,希望各位可以给出一个精确的数据。 谢谢啦。…

查看全部问答>

基于CP2102的USB接口设计

基于CP2102的USB接口设计…

查看全部问答>

求protel2004的单片机的PCB封装库

哪位仁兄有单片机的封装库啊?万分感激!!!!…

查看全部问答>

听说这的牛人很多~特来求救!!!!!!!!!!!!

就是关于用vhdl做的一个数字密码锁。。具体要求如下: 1.4位密码十进制数(0-9) 2.密码设置键 开锁键 清屏键 3.显示:4位密码led(开锁时可见。密码设置为x),锁状态1红(lock)1绿(open)密码错误1红(闪烁) 4.密码错误,报警(声音) 5. ...…

查看全部问答>

【已解决】TIM4的Remap死活不干活,请求协助!!!

    GPIO_InitStructure.GPIO_Pin =  GPIO_Pin_14;    GPIO_InitStructure.GPIO_Mode = GPIO_Mode_AF_PP;    GPIO_InitStructure.GPIO_Speed =&n ...…

查看全部问答>

UM0721(USBOTGFSlibrary)提供的源码有问题?

UM0721文档里说,打开Project\\RVMDK\\下的keil工程后是这样: 下载 (10.29 KB) 2010-7-8 21:03 下载的um0721.zip解压缩后的确也有这些文件,但是用Keil4那个Uv2工程文件打开却是这样的: 下载 (2.53 ...…

查看全部问答>

怀疑买到的STM32F103VET6是翻新货

最近在淘宝上买到了几片STM32F103VET6的片子,焊在板子上后发现PD8脚作为GPIO的上拉输入无效,读取电平总是高电平,换了另一片后任然是这个问题,换上STM32F103VCT6是没问题的,然后怀疑是这批片子是翻新的,它的外观也和以前买到的ST的ARM不 ...…

查看全部问答>