历史上的今天
今天是:2024年11月15日(星期五)
2018年11月15日 | DSP将成端侧AI核战主角?
2018-11-15 来源:爱集微
随着AI不断从云向端“下沉”,端侧AI处理器核的竞争也日趋激烈,既有老牌劲旅,也有初生新贵,但总体不外乎DSP、GPU、CPU等在暗较长短,比拼的或不是性价比那么简单,背后的软件支持、生态、服务等均是考验。
端侧AI看重功耗和可扩展
从市场来看,无论是物联网、智能手机、自动驾驶汽车、安防、机器人、无人机、AR/VR等领域的设备端,无不在拥抱神经网络推理应用,不断加速端侧AI的生长。
Cadence公司IP事业部Tensilica技术营销总监Yipeng Liu对此分析说,一方面是算法发展快速,一年就可迭代多次,因而也越来越简化;另一方面以往多是浮点运算,但现在也可定点运算,这对精度和带宽也走低。
对于市场上的核战主力,Cadence Tensilica IP产品管理和营销高级总监Lazaar Louis表示,DSP、GPU、CPU等各有优势与不足,CPU擅长管理和调度,DSP和GPU均强于运算,但GPU更适合流处理的算法,而DSP算力强劲,但需要配套软件跟上,才利于开发。
但应用对端侧AI处理器核的考量除算力外,功耗表现至关重要。“AI处理器的应用发展迅速,但运行最新的神经网络模型会使功耗日益重要。”Linley Group资深分析师Mike Demler如此说道。
此外,为满足应用从物联网传感器到自动驾驶汽车等设备的AI功能需求,Mike Demler 看好高效的可扩展性架构。“神经网络推理需求涉及不同量级的AI处理和多种神经网络类型,这需要一种可扩展的架构,需要数十甚至数百TMAC。”Lazaar Louis强调说。
新型DSP的表现
针对上述需求,Cadence全新开发的首款深度神经网络加速器(DNA)AI处理器IP Tensilica DNA 100可谓有备而来。
要知道,Cadence的Tensilica IP享有盛名,年出货量已达50亿颗,是DSP领域排名第一的IP,在全球拥有200多个生态伙伴。Lazaar Louis介绍,在其产品线中,不同IP各司其职,Fusion、ConnX IP分别负责汽车雷达及通信、5G等运算,Vision负责视觉处理,HiFi负责音视频处理,而DNA 100则将在端侧分析与决策发挥作用。
DNA 100处理器非常适用乘法累加运算(MAC)解决方案,性能提升达 4.7倍,每瓦特性能提升高达2.3倍。Lazaar Louis提到,DNA 100采用了创新稀疏计算引擎,可用更小的阵列实现最大吞吐量,因而实现高性能低功耗共存。在4K MAC配置环境下,ResNet 50推理性能预计能实现每秒高达2550帧(fps)和3.4TMAC / W(在16 nm工艺)。此外,它还可通堆叠实现数百TMAC,实现更高算力。
在生态层面,DNA 100也做足了功课。据悉,DNA 100处理器配备完整的AI软件平台,兼容最新版本的Tensilica神经网络编译器,支持Caffe、TensorFlow、TensorFlow Lite等高级AI框架。同时,DNA 100处理器还提供包括分类、对象检测、分割、重复和回归等在内的软件支持。它还支持安卓神经网络(ANN)API,可用于安卓设备端的AI推理。
此外,针对大热的端侧语音算法处理,Cadence还发布了Tensilica HiFi 5 DSP。Yipeng Liu指出,诸多应用对于低延时需求、连接可用性以及安全需求,催生了端侧语音处理需求。而HiFi 5 DSP通过架构创新,实现优化的浮点和定点DSP能力,在消除噪音和回音以及正确识别层面再度进阶。相比前一代,音频处理性能提升2倍,神经网络处理MAC性能提升 4倍,并配备专门优化的库函数和软件包,将成为数字家庭、车载娱乐系统等应用的理想选择。
史海拾趣
|
由于LCD本质上是一种选择性的滤光器,且环境照明产生的显示亮度往往不够,因此,必须在LCD的背面放置光源。放置背面光源的方法有好几种,不同的背面照明光源应用的场合有所不同。 早期的LCD背面照明主要用于膝上型电脑或笔记本电脑,由于这些设备 ...… 查看全部问答> |
|
FSEZ1317;隔离85-265V输入,输出350mA; 本来3个LED灯 3.0-3.4v的标准设计输出电压,输出至多10.2V就够了 ,原先我的设计就是10.2v;空载(放电电阻4.3K)的时候一切正常挺好,宽压下都是恒压恒流; 由于变动,调节输出电压到11v(客户要求有时候 ...… 查看全部问答> |
|
请教MAXII高手,maxii 570系列芯片的jatg下载电缆问题 我是刚刚接触CPLD的新手 我最近在尝试altera公司max2芯片570系列的作开发 用的软件是QII 到下载的时候 首先是不能识别硬件 装完驱动之后识别硬件,下载的时候有 “start”但是点了就ERROR 是不是MAXII570系列的JATG下载电缆不能 ...… 查看全部问答> |
|
关于开发基于wince4.2+evc4.0的access数据库应用程序问题。。。 最近参照《EVC高级编程及其应用开发》这本书的关于access数据库应用程序的例子 做个小项目:(开发环境是:wince4.2+evc4.0模拟器是ppc 2003) 发现按照那本书的提示编译调试成功后发现access数据库创建不出来,设置断点打显示出我创建数据库的sq ...… 查看全部问答> |
|
GPRS模块,PC串口能接收数据,飞凌OK6410串口接收不到 用的OK6410的板子,非飞凌的GPRS模块。想实现在ARM上与GPRS模块通讯。相同的代码,PC上可以接收到GPRS的数据,ARM上收不到。 用MFC编写程序,调用writefile和readfile实现串口读写。用的是扩展板上的串口COM1。 将GPRS模块连接PC串口,能实现向模 ...… 查看全部问答> |
|
几乎每个FPGA设计都离不开复位,但很多工程师都没有真正关心过复位的设计。当你遇到一些奇怪的问题,也许就是由复位不当引起的。 对于同步单元,可以选择同步复位、异步复位或者不复位。有些人对不复位存有疑问,在ASIC设计中 ...… 查看全部问答> |




