历史上的今天
今天是:2025年06月26日(星期四)
2019年06月26日 | 瑞萨电子展示三进制存储器的存算一体化AI加速器
2019-06-26 来源:EEWORLD
目前,有许多用于各种机器学习模型的硬件加速器,日前瑞萨电子已经提出了一种基于SRAM的三进制系统来加速卷积神经网络(CNN)计算,也就是通常所说的存算一体化。采用该加速器的瑞萨测试芯片实现了8.8 TOPS/W的功率效率,这是业界最高级别的功率效率。瑞萨加速器基于内存处理(PIM)架构,这是一种越来越流行的AI技术方法,其中当从该存储器读出数据时,在存储器电路中执行乘法和累加运算。
机器学习的挑战之一是围绕输入和输出的数据以及计算中涉及的权重进行优化。瑞萨此次采用的是三进制方式,通过使用两个单比特存储单元实现-1,0或1的数据结构。

瑞萨的硬件可以利用存储值为-1,0或1的三进制存储单元。
基本的三进制存储可以组合成多位解决方案,从而可以实现不同的精度,允许用户优化精度和功耗之间的平衡。

硬件可以将三进制计算结合到多位操作中
传统存储器使用模数转换器(ADC)读取内容。这是一种经典的方法,但它需要空间用于ADC和电源。瑞萨将1位读出放大器比较器与复制单元相结合,可以灵活地控制电流,从而开发出高精度的存储器数据读出电路。

当检测到MAC结果等于零的状态时,“零检测器”可以停止比较器的操作
该策略意思是:通过神经网络操作激活的节点(神经元)的数量非常小,约为1%,可以通过停止未激活神经元的电路,从而实现低功耗操作,同时显著降低功耗。
由于制造过程中的工艺变化,导致SRAM结构中位线电流值产生误差,从而造成存储器读取数据时出现错误。为解决这个问题,瑞萨在芯片内部覆盖了多个SRAM计算电路模块,由制造工艺变化最小的模块执行计算任务。由于激活节点只是所有节点中的一小部分,因此激活节点被有选择地分配给制造过程变化最小的SRAM计算电路模块执行计算。从而将计算误差降至几乎可忽略的水平。

通过多个SRAM计算块以解决由于工艺问题导致的计算误差。
在VLSI会议上,瑞萨展示了内存处理(PIM)架构的芯片,该芯片采用12nm技术,包含四个集群,每个集群均包含了PIM、逻辑以及传统的SRAM存储器。每个集群可以独立运行,因此,该系统一次可以管理多达四个CNN模型。该芯片最多可处理128个CNN层。PIM存储量为4.74 Mb,SRAM存储量为12.58 Mb。

瑞萨展示的具有四个cluster的三进制PIM
瑞萨推出了以下三种技术。一是可执行大规模CNN计算的三进制(-1,0,1)SRAM结构PIM技术。二是与比较器配合使用的SRAM电路,可在低功耗下读取存储器数据。三是能够防止在制造过程中因工艺变化而导致的计算错误。将以上技术结合,既能缩短深度学习处理中的存储器访问时间,又可降低乘法和累加运算所需的功率。因此,当通过手写字符识别测试(MNIST)进行评估时,新加速器在保持99%以上准确率的同时,达到了业界最高能效等级。
尽管该芯片目前只是原型阶段,但它的确证实了通过新架构,可在降低功耗的同时显著提高产品性能。
史海拾趣
|
C语言嵌入式系统编程(收集大发送之3——嵌入式系统的C程序设计) 嵌入式系统的C程序设计.pdf 作 者】KirK Zurell【译 者】艾克武 张剑波 艾克文【原出版社】R&D BOOKS【出 版 社】机械工业出版社-华章【出版时间】2002-01-01 第1章 简介 1.1 本书的作用 1.2 嵌入式系统中使用C语言的好处 1.3 本书概览 ...… 查看全部问答> |
|
智能仪表是自动控制技术的重要组成部分。随着智能仪表在工业控制、通信和汽车电子中的广泛应用,智能仪表逐渐向数字化、网络化、智能化方向发展;同时,智能仪表复杂度不断增加,对实时性要求几乎达到了苛刻的程度。在编程方式和代码重复利用等方面 ...… 查看全部问答> |
|
我做好了一个数码显示的程序,数码管显示从1走到999.但是有的时候断电后就自动又从零开始走,我现在想让它断电把数据记下来我已经做好了一个断电检测电路我已经写了一点断电的程序,但是就是实现不了断电之前的数据记下来,每次还是断电后就从0开始 ...… 查看全部问答> |
|
请问: linux在内核空间用vmalloc最大能分配多少内存? 在用户控件用malloc最大能分配多少内存? 分配的最大值在内核中可以修改吗?怎么修改? 我用的ARM2440,内存128M,linux内核是2.6.13 谢谢!… 查看全部问答> |
|
本人阅读 Jean J.Labrosse 由卲贝贝翻译的 北京航空航天大学出版社 出版的《嵌入式实时操作系统uC/OS-II(第二版)》 两遍,发现有个不妥的地方(只是不妥,但是不能算是错误),还希望各大虾指教与斧正! 在书本103页 讲到3.10 uCOSII 中的中断,示意性 ...… 查看全部问答> |
|
在Visual Studio2005中怎样连接到 WinCE6 设备 在Visual Studio2005中开发一个应用程序,需要与WinCE6设备连接进行调试。 在网上看到可以通过在设备端运行conmanclient2,cMaccept,pc端运行“连接到设备” ,但是提示未安装activesync,安装以后,再运行,提示“设备未就绪“,我是通过网络接口 ...… 查看全部问答> |
|
为解决市场主流充电器缺少电池容量检测功能以及电池充满电量后不能 自动断电等问题,设计了一种以 MS P 4 3 0单片机为控制核心、D S 1 3 0 2为外围时钟电路芯片、具有检测电池容量功能的充电器,并给出了单元模块设计电路和配套的软件流程图。实验 ...… 查看全部问答> |




