历史上的今天
今天是:2025年02月18日(星期二)
2021年02月18日 | 三星HBM-PIM芯片问市,功耗可降低70%
2021-02-18 来源:半导体行业观察
三星宣布,其新的基于HBM2的内存具有集成的AI处理器,该处理器可以提供最高达1.2 TFLOPS的嵌入式计算能力,从而使内存芯片本身能够执行通常由CPU,GPU,ASIC,或FPGA处理的工作。
新的HBM-PIM(processing-in-memory)芯片将AI引擎注入每个存储体中,从而将处理操作转移到HBM本身。新型的内存旨在减轻在内存和处理器之间移动数据的负担,因为这个操作带来的功耗和时间比实际的计算操作更为昂贵。
三星表示,将其应用于现有的HBM2 Aquabolt内存后,该技术可以提供两倍于系统的性能,同时将能耗降低70%以上。该公司还声称,新内存不需要任何软件或硬件更改(包括对内存控制器的更改),从而为早期采用者提供了更快的上市时间。
三星表示,这种存储器已经在领先的AI解决方案提供商的AI加速器中进行了试验。该公司预计所有验证工作都将在今年上半年完成,这标志着快速进入市场的道路。
深挖三星HBM-PIM内存
三星在本周的国际固态电路虚拟会议(ISSCC)上展示了其新存储器架构的详细信息。

如您在上面的幻灯片中看到的那样,每个存储库都有一个嵌入式可编程计算单元(PCU),其运行频率为300 MHz,每个裸片总共32个PCU。这些单元通过来自主机的常规存储命令进行控制,以启用DRAM中处理功能,并且它们可以执行各种FP16计算。该存储器还可以在标准模式下运行,这意味着它可以像普通HBM2一样运行,也可以在FIM模式下运行以进行内存中数据处理。

自然地,为PCU单元腾出空间会减少内存容量-每个配备PCU的内存芯片的容量(每个4Gb)是标准8Gb HBM2芯片的一半。为了帮助解决该问题,三星通过将四个4Gb裸片与PCU和四个不带PCU的8Gb裸片组合在一起来使用6GB堆栈(与之相比,带有普通HBM2的8GB堆栈)。
值得注意的是,上面的论文和幻灯片将这种技术称为功能内存DRAM(FIMDRAM),但这是该技术的内部代号,该技术现在带有HBM-PIM品牌名称。三星的示例基于20纳米原型芯片,该芯片在不增加功耗的情况下可实现每针2.4 Gbps的吞吐量。
本文将基础技术描述为“功能于内存的DRAM(FIMDRAM),该功能在存储库中集成了16宽单指令多数据引擎,并利用存储库级并行性提供了比关闭存储高4倍的处理带宽。芯片存储器解决方案。其次,我们展示了无需对常规存储器控制器及其命令协议进行任何修改的技术,这些技术使FIMDRAM在快速工业应用中更加实用。”
但是,至少在目前,我们不会在最新的游戏GPU中看到这些功能。三星指出,这种新内存注定要满足数据中心,HPC系统和支持AI的移动应用程序中的大规模处理要求。
与大多数内存处理技术一样,我们希望这项技术将突破存储芯片散热限制的边界,尤其是考虑到HBM芯片通常部署在堆栈中,而这些堆栈并不完全有利于轻松散热。三星的演讲没有涵盖HBM-PIM如何应对这些挑战。
三星电子存储器产品计划高级副总裁Kwangil Park表示:“我们开创性的HBM-PIM是业内首个针对各种AI驱动的工作负载(如HPC,培训和推理)量身定制的可编程PIM解决方案。我们计划以此为突破通过与AI解决方案提供商进一步合作以开发更高级的PIM驱动的应用程序。”
史海拾趣
|
我一共有5个文件 SqlceControl.h SqlceControl.cpp sample.h sample.cpp resource.h 在SqlceControl.h中#include 在SqlceControl.cpp中#include \"SqlceControl.h\" 在sample.h中#include #include \"resource.h\" #include \"SqlceContr ...… 查看全部问答> |
|
本人想移植一个uC/OS-II到51(C8051F040)单片机上,C语言部分编译链接成功,与MCU相关的汇编部分虽然编译成功却无法链接(OS_CPU_A.ASM 文件)。 1. OS_CPU_A.ASM文件如下: $NOMOD51 EA BIT   ...… 查看全部问答> |
|
WinCE USB驱动,从5.0移植到4.2。需要注意什么? 目前需要将usb转串口驱动,从ce5.0移植到4.2系统,时间要求很紧。请问各位大侠移植难度大吗?需要注意什么问题?谢谢!… 查看全部问答> |
|
最近用edk实现一个外部中断,我希望是上升沿触发,但是发现是上升沿和下降沿都触发。想问下各位高手怎么设置能让他上升沿触发?我在xparameter.h中,中断的那部分添加了如下语句#define XPAR_INTC_0_KIND_OF_INTR 0x00000001#define XPAR_INTC_0_KI ...… 查看全部问答> |
|
同主题,想在9B90上移植modbus协议。 找到freemodbus程序,底层的定义能大概看明白,但是官网上说可以跟现在modbud/tcp 可以lwip的TCPIP协议。 参考例子各种看不懂啊,需要建立线程(参数也不对), lwip_init自定义(为啥不用lwip ...… 查看全部问答> |
|
关于单片机的双机通信程序编写的问题,希望得到各位的帮助,多谢了!!! 想请教下高人,我做了个双机通信,甲机进行AD转换并传送数据给乙机进行处理,而乙机接收并做键盘扫描。问题是乙机数据接收到但键盘的键值无法显示出来,扫健的程序我做成了中断,单独进行按键显示是成功的,程序没问题。下面是我的乙机接收端的程序 ...… 查看全部问答> |




