历史上的今天
今天是:2025年03月20日(星期四)
2020年03月20日 | Socionext成功测试载有DNN引擎的低功耗AI芯片
2020-03-20 来源:EEWORLD
SoC 设计与应用技术领导厂商Socionext Inc.(以下“公司”)宣布成功发开一款集成有量化深度神经网络(DNN)技术的原型芯片,可为小型、低功耗边缘计算设备提供先进的AI处理。
受日本新能源与产业技术综合开发机构(NEDO)委托,Socionext参与了以《先进的低功耗AI-Edge LSI技术开发》为课题的项目研究,成功完成了结合量化DNN技术的芯片测试,并确认了其运行和性能。该测试芯片搭载有“量化DNN引擎”,能以高速、低功耗执行深度学习推理处理。

目前,基于通用GPU的边缘计算处理器无法满足日益增长的人工智能处理需求。以搭载有图像识别和分析功能的边缘计算设备为例,其系统功耗和发热量与通用GPU相比有明显增加,不得不通过提升成本扩容设备等方式满足AI处理需求。
量化DNN引擎
为提高AI处理性能并减少系统功耗,Socionext开发了一款采用“量化DNN技术”的专有体系架构,它减少了深度学习所需的参数和激活位。该体系架构将1-bit (binary)、2-bit (ternary) 低比特率技术、传统8-bit技术及公司独创的参数压缩技术结合,以较少的计算资源执行大量计算处理,并减少数据量。
除此以外,Socionext还开发了一种新颖的片上存储技术,可提供高效的数据传输,从而减少深度学习通常所需的大容量片上或外部存储器。
通过结合上述新技术,Socionext将AI芯片及“DNN引擎”原型化,并确认了其功能和性能。 原型化芯片通过“YOLO v3”以不到5W的低功耗及30fps的速度实现了目标检测,其效率是通用GPU的10倍。 此外,该芯片还配备了高性能、低功耗的Arm Cortex-A系列CPU,无需外部处理器即可以单芯片执行整个AI处理。
深度学习软件开发环境
除硬件开发外,Socionext还构建了深度学习软件开发环境,通过结合TensorFlow作为基本框架,允许开发人员用原始低bit位进行量化感知训练(Quantization Aware Training)和训练后量化(Post Training Quantization)。 开发新芯片时,用户可以选择最佳量化技术并将其应用于各种神经网络中执行高精度处理,例如在小型低功耗边缘设备上增设最先进的计算机视觉功能,应用于高级驾驶员辅助系统(ADAS)、监控摄像头和工厂自动化等场景。
Socionext目前正在通过对该原型芯片进行评估进一步调整电路优化其性能。公司将继续与合作伙伴一起共同开发并交付AI-Edge LSI最终产品,完成NEDO的委托项目。
史海拾趣
|
同步时序机的最短时钟周期是时序机性能的一个重要的指标。它受到通过 机器组合逻辑的传播延时的限制。同步机的吞吐率就是数据输入机器和由机器 产生数据的速率.... 作为一种能够提高电路性能的可选方法,可以将流水线寄存器插入到组合逻 辑的 ...… 查看全部问答> |
|
MDK中不能使用Goto Definition Goto Reference的解决方法 在用RealView MDK进行嵌入式软件开发的过程中。我们可能需要得知某个变量的类型或者是某个常量的值。或者查找某个函数的原型及其定义。要做到这些有一个最简单的办法就是逐个源文件去查找。或者使用开发工具的文件搜索功能。另外RealView MDK提供了 ...… 查看全部问答> |
|
现在要在web界面上作ping测试,放置一个按钮,点击按钮后,开始执行ping测试,并将结果输出到一个文本区,请问如何实现?脚本用javascript,javascript如何调用系统API?… 查看全部问答> |
|
为什么SOPC中没有添加和jtag下载有关的组件 但是jtag下载方式却可以用呢 板子上不是也有jtag下载的接口和引脚吗? 为什么SOPC里不需要添加和它相关的组件?… 查看全部问答> |
|
体验一个全新的RTOS——QNX(基于TI AM3517EVM KIT &beagleboard C4) 最近两个月来一直在做关于QNX的一些工作,说简单一点就是在AM3517和OMAP3530上跑跑QNX系统,最近比较有时间写一些关于QNX的小东西,分享一下经验,也总结一下自己的工作。由于是用到车上的,就暂且将这个帖子 ...… 查看全部问答> |




