历史上的今天
返回首页

历史上的今天

今天是:2025年06月26日(星期四)

正在发生

2019年06月26日 | 瑞萨电子展示三进制存储器的存算一体化AI加速器

2019-06-26 来源:EEWORLD

目前,有许多用于各种机器学习模型的硬件加速器,日前瑞萨电子已经提出了一种基于SRAM的三进制系统来加速卷积神经网络(CNN)计算,也就是通常所说的存算一体化。采用该加速器的瑞萨测试芯片实现了8.8 TOPS/W的功率效率,这是业界最高级别的功率效率。瑞萨加速器基于内存处理(PIM)架构,这是一种越来越流行的AI技术方法,其中当从该存储器读出数据时,在存储器电路中执行乘法和累加运算。

机器学习的挑战之一是围绕输入和输出的数据以及计算中涉及的权重进行优化。瑞萨此次采用的是三进制方式,通过使用两个单比特存储单元实现-1,0或1的数据结构。


图片.png?imageView2/2/w/550

瑞萨的硬件可以利用存储值为-1,0或1的三进制存储单元。


基本的三进制存储可以组合成多位解决方案,从而可以实现不同的精度,允许用户优化精度和功耗之间的平衡。


图片.png?imageView2/2/w/550
硬件可以将三进制计算结合到多位操作中


传统存储器使用模数转换器(ADC)读取内容。这是一种经典的方法,但它需要空间用于ADC和电源。瑞萨将1位读出放大器比较器与复制单元相结合,可以灵活地控制电流,从而开发出高精度的存储器数据读出电路。


图片.png?imageView2/2/w/550

当检测到MAC结果等于零的状态时,“零检测器”可以停止比较器的操作


该策略意思是:通过神经网络操作激活的节点(神经元)的数量非常小,约为1%,可以通过停止未激活神经元的电路,从而实现低功耗操作,同时显著降低功耗。

由于制造过程中的工艺变化,导致SRAM结构中位线电流值产生误差,从而造成存储器读取数据时出现错误。为解决这个问题,瑞萨在芯片内部覆盖了多个SRAM计算电路模块,由制造工艺变化最小的模块执行计算任务。由于激活节点只是所有节点中的一小部分,因此激活节点被有选择地分配给制造过程变化最小的SRAM计算电路模块执行计算。从而将计算误差降至几乎可忽略的水平。


图片.png?imageView2/2/w/550
通过多个SRAM计算块以解决由于工艺问题导致的计算误差。


在VLSI会议上,瑞萨展示了内存处理(PIM)架构的芯片,该芯片采用12nm技术,包含四个集群,每个集群均包含了PIM、逻辑以及传统的SRAM存储器。每个集群可以独立运行,因此,该系统一次可以管理多达四个CNN模型。该芯片最多可处理128个CNN层。PIM存储量为4.74 Mb,SRAM存储量为12.58 Mb。


图片.png?imageView2/2/w/550

瑞萨展示的具有四个cluster的三进制PIM


瑞萨推出了以下三种技术。一是可执行大规模CNN计算的三进制(-1,0,1)SRAM结构PIM技术。二是与比较器配合使用的SRAM电路,可在低功耗下读取存储器数据。三是能够防止在制造过程中因工艺变化而导致的计算错误。将以上技术结合,既能缩短深度学习处理中的存储器访问时间,又可降低乘法和累加运算所需的功率。因此,当通过手写字符识别测试(MNIST)进行评估时,新加速器在保持99%以上准确率的同时,达到了业界最高能效等级。

尽管该芯片目前只是原型阶段,但它的确证实了通过新架构,可在降低功耗的同时显著提高产品性能。

推荐阅读

史海拾趣

中环(Central)公司的发展小趣事

中环公司一直致力于技术创新和研发。在太阳能单晶硅制造领域,公司不断推出新的技术和产品,以满足市场的不断变化。2009年,公司在内蒙古投资建设了太阳能级单晶硅工厂,开始进行太阳能级单晶硅产品的规模生产,并成功研发和应用了金刚线DW切割工艺。这一创新技术大大提高了生产效率和产品质量,使中环在行业中取得了领先地位。

Crowd Supply公司的发展小趣事

随着Crowd Supply在美国的成功运营,公司开始考虑全球扩张。他们首先在欧洲和亚洲设立了办事处和仓库,以便更好地服务这些地区的项目和支持者。同时,Crowd Supply也积极寻求与当地的合作伙伴建立关系,共同推广硬件创新。这些合作不仅为平台带来了更多的项目资源,也提升了其在全球范围内的影响力。

對餘科技(DIOFIT)公司的发展小趣事

在市场竞争日益激烈的情况下,DIOFIT公司凭借敏锐的市场洞察力和灵活的营销策略,不断拓展市场份额。他们针对不同地区、不同行业的需求,制定个性化的产品推广方案,通过线上线下相结合的方式,加强品牌推广和渠道建设。同时,DIOFIT公司还积极参与各类展会和论坛,与业界同仁交流合作,拓展国际视野,为公司的发展注入新的活力。

Emmoco公司的发展小趣事

Emmoco一直将品质管理作为公司发展的核心。公司建立了完善的质量管理体系,从原材料采购到生产、检测、包装等各个环节都进行严格的质量控制。同时,Emmoco还注重持续改进,通过引入先进的生产设备和工艺、优化生产流程等方式,不断提高产品质量和生产效率。这些举措使得Emmoco的产品在市场上赢得了良好的口碑和声誉。

Frolyt Condensers & Elements GmbH公司的发展小趣事

在电子元件领域,Frolyt Condensers & Elements GmbH起初是一家专注于电容器研发的小型制造商。2005年,公司研发团队成功开发出一种新型高性能铝电解电容器,该电容器在耐高温、长寿命和低阻抗方面表现出色,迅速吸引了市场的关注。通过持续的技术创新和严格的品质控制,Frolyt的电容器产品在汽车电子、通信设备等多个领域得到广泛应用,公司因此实现了市场份额的快速增长。

Aavid Niagra公司的发展小趣事

随着电子产品的更新换代速度加快,散热技术也面临着更高的要求。Aavid Niagra公司敏锐地捕捉到了这一市场变化,加大了在研发方面的投入,推出了一系列创新性的散热产品。这些产品不仅提高了电子设备的性能稳定性,还大大降低了能耗,赢得了客户的广泛好评。公司的技术创新能力成为了其持续发展的核心竞争力。

问答坊 | AI 解惑

C语言嵌入式系统编程(收集大发送之3——嵌入式系统的C程序设计)

嵌入式系统的C程序设计.pdf 作  者】KirK Zurell【译  者】艾克武 张剑波 艾克文【原出版社】R&D BOOKS【出 版 社】机械工业出版社-华章【出版时间】2002-01-01 第1章 简介 1.1 本书的作用 1.2 嵌入式系统中使用C语言的好处 1.3 本书概览 ...…

查看全部问答>

一种嵌入式微调度器的实现方法

智能仪表是自动控制技术的重要组成部分。随着智能仪表在工业控制、通信和汽车电子中的广泛应用,智能仪表逐渐向数字化、网络化、智能化方向发展;同时,智能仪表复杂度不断增加,对实时性要求几乎达到了苛刻的程度。在编程方式和代码重复利用等方面 ...…

查看全部问答>

那位高人指点EEPROM程序

我做好了一个数码显示的程序,数码管显示从1走到999.但是有的时候断电后就自动又从零开始走,我现在想让它断电把数据记下来我已经做好了一个断电检测电路我已经写了一点断电的程序,但是就是实现不了断电之前的数据记下来,每次还是断电后就从0开始 ...…

查看全部问答>

在linux内核空间用vmalloc最大能分配多少内存?

请问: linux在内核空间用vmalloc最大能分配多少内存? 在用户控件用malloc最大能分配多少内存? 分配的最大值在内核中可以修改吗?怎么修改? 我用的ARM2440,内存128M,linux内核是2.6.13 谢谢!…

查看全部问答>

对uCOS操作系统提点问题!!希望能得到解决!

本人阅读 Jean J.Labrosse 由卲贝贝翻译的 北京航空航天大学出版社 出版的《嵌入式实时操作系统uC/OS-II(第二版)》 两遍,发现有个不妥的地方(只是不妥,但是不能算是错误),还希望各大虾指教与斧正! 在书本103页 讲到3.10 uCOSII 中的中断,示意性 ...…

查看全部问答>

在Visual Studio2005中怎样连接到 WinCE6 设备

在Visual Studio2005中开发一个应用程序,需要与WinCE6设备连接进行调试。 在网上看到可以通过在设备端运行conmanclient2,cMaccept,pc端运行“连接到设备” ,但是提示未安装activesync,安装以后,再运行,提示“设备未就绪“,我是通过网络接口 ...…

查看全部问答>

放在衣服口袋内的定时器

本帖最后由 jameswangsynnex 于 2015-3-3 20:03 编辑 …

查看全部问答>

UART2僵住了

UART2僵住了用STM32F103,遇到一个奇怪的问题. 正常状态下,uart2定期发送一些数据出来. 因某种未知的原因,发生了奇怪的状态:软件上的发送流程还在进行,但是端口上没有数据出来.确认了CR1,CR2,CR3,BRR,GPTR都未发生改变.uart2对应的IO ...…

查看全部问答>

【MSP430共享】具有检测电池容量功能的充电器设计

为解决市场主流充电器缺少电池容量检测功能以及电池充满电量后不能 自动断电等问题,设计了一种以 MS P 4 3 0单片机为控制核心、D S 1 3 0 2为外围时钟电路芯片、具有检测电池容量功能的充电器,并给出了单元模块设计电路和配套的软件流程图。实验 ...…

查看全部问答>