历史上的今天
返回首页

历史上的今天

今天是:2025年03月06日(星期四)

正在发生

2018年03月06日 | 浅析AI芯片性能乱象 AI芯片=DSP+DSP+……+DSP?

2018-03-06 来源:新浪

  所谓人工智能,根据1956年达特茅斯会议的定义,就是“让机器行为看起来就像是人所表现出来的智能行为一样”。不过虽然这句话理解起来很简单,想真正实现却非常困难。在人工智能的发展过程中,逐渐划分出两个发展阶段:强人工智能和弱人工智能。


  强人工智能是属于人类级别的人工智能,机器拥有思维和意识,可以实现自我推理和自主决策。弱人工智能则是指机器擅长于处理单一方面的问题,但并没有真正的思维和意识。由于弱人工智能发展程度并没有达到模拟人脑思维的程度,所以弱人工智能仍然属于“工具”的范畴,与传统的“产品”在本质上并无区别。



  目前整个业界所研发的全部人工智能产品,甚至是Alpha Go,都仅限于弱人工智能这个阶段,许多打着各种幌子的“伪”人工智能也一并充斥在这片红海中。与此同时,作为人工智能的硬件基础,AI芯片也在短短的一年之内“满山鲜花开满坡”。


  向上看,有谷歌TPU和NVIDIA GPU这样的巨无霸,不是下棋就是开汽车,一个萝卜一个坑的占着几个摊子。向下看,有各大移动SoC厂商的AI芯片,输了体积不输阵,也都是规格明码标价,性能头头是道。


  然而,“你不觉得AI芯片是个伪概念吗?”这样的疑问却从一位AI芯片从业者口中说出,“从半导体圈子的人来看,AI芯片概念比较怪,定义也非常宽泛。你做机器学习也是AI芯片,做深度学习也是AI芯片,做某几种特定算法也是AI芯片。”


  的确,对于目前这些AI芯片的功能,各家确实都少有明确的描述,基本上都是一句“AI任务”带过。


不明所以的「AI任务」


不明所以的‘AI任务’


  这“AI任务”到底是个啥?一番细看之下,原来大多数所谓的“AI任务”指的都是视频、音频、图像处理这些方面。这些都是非常传统的需求,而且也都有专用处理器来应对,音视频处理有DSP,图像处理有ISP。


  其实无论是视频音频还是图像处理,这些工作都可以在CPU上完成。之所以专门设计DSP和ISP芯片,是因为它们处理这些任务的效率比CPU高出许多。同样的,如果全新的AI芯片能比传统DSP和ISP更加高效,那在处理器中加入AI芯片的同时,我们理应看到DSP和ISP从现有芯片组成中消失才对。


  在高通官网的骁龙845介绍中,“可提供更丰富的拍摄、语音、XR 和游戏体验”的人工智能平台,依然被高通明确的归结在Hexagon DSP下,说明现在各家AI芯片所宣传的这些功能,并未达到真正意义上AI所在的层次,只是对既有需求的扩展而已。

人工智能平台依然被高通明确的归结在Hexagon DSP下


人工智能平台依然被高通明确的归结在Hexagon DSP下


  坊间有过这样的传闻,说有一家公司出了款AI芯片,但实际上只是几颗传统DSP(数字信号处理器)芯片的组合,再加上一些软件层面的修改。


  对于这条传言的由来,我们无据可考,虽然高通现如今将Hexagon DSP作为支撑AI的基石,看起来这种说法好像也有几分道理,但也不能排除这只是“同行是冤家”所引起的非议。而且图灵老爷子于1950年提出的图灵测试,针对的是一个AI系统的整体表现,对于AI硬件的测试,目前市面上尚没有专业的通用测试标准。


  不过在前不久,鲁大师在其评测软件中添加了一套AI性能评测,同时支持海思麒麟的HiAI和高通的SNPE框架,也支持在CPU上运行TensorFlow推断库。这套AI测试包含了三种不同的神经网络模型:VGG16,InceptionV3以及ResNet34,输入的测试数据是ImageNet数据库中的100张图片。


鲁大师AI性能评测


鲁大师AI性能评测


  国外知名媒体Anandtech选择了使用麒麟960的华为Mate 9、使用麒麟970的华为Mate 10 Pro、使用骁龙835的谷歌Pixel 2 XL和LG V30四款手机,分别测试了ARM CPU、Hexagon DSP和NPU的AI性能,测试结果以性能(fps)和效能(mJ/inference)双重指标来衡量。


  我们首先注意到的一个结果是,NPU和CPU在处理AI运算时的性能有着几十倍的巨大差异。这些算法在CPU上执行的速度最高不过2fps,同时还会消耗掉大量的电能。无论是骁龙835还是麒麟960的CPU平均功耗都已经超过可持续工作的上限。


  作为对比,骁龙835的Hexagon DSP相比CPU约有8~10倍的性能提升,而麒麟970的NPU性能又可达到Hexagon DSP的1.5倍~4倍。不过在能耗比方面,虽然华为NPU相比CPU有着巨大到已经不在一个次元的优势,但我们也很惊讶的看到,骁龙835的Hexagon DSP的综合效率落后麒麟970的NPU仅6%左右。

Anandtech的测试结果


Anandtech的测试结果


  虽然鲁大师不管在PC和手机端,都素有“娱乐大师”这样一个不怎么好听的绰号,单单这三个测试项也无法代表麒麟970的NPU的全部性能,但我想鲁大师应该无意在目前的AI测试中对谁有所偏重,软件中所选择的这三个测试项目应该是比较常见且通用的。毕竟现阶段的安卓阵营里,宣称有AI加速能力的也就只有骁龙835/845和华为麒麟970而已。


  我们知道,AI芯片在美国要经过严苛的NSF认证:“要让DNN(深度神经网络算法)计算功耗比提升1000倍的芯片”,这也许是高通依然将人工智能平台归结在Hexagon DSP下的原因之一吧。


瑞芯微自曝的RK3399Pro成绩颇为惊人


瑞芯微自曝的RK3399Pro成绩颇为惊人


  我在之前的文章里也曾经说过,目前绝大部分AI芯片,都是厂商对AI大潮反应过激的产物,好像如果名字里没有AI,都不好意思在江湖上报号。那个坊间传闻,虽然并没有任何实锤,但也许真的是目前AI芯片领域现状的映射。


  想要在量子计算时代到来前,在传统半导体工业中实现真正的强人工智能,除了要进行大刀阔斧的芯片架构研发,还要引进新的电子元器件——忆阻。其实这东西说新也不新,忆阻是除电阻、电容、电感之外的第四大电路元件,早在 1971 年,任教于美国的柏克莱大学的华裔科学家蔡少棠便提出了忆阻器的概念。


  现行的计算机体系中最常见的是“冯•诺依曼架构”,即计算机由存储器、控制器、运算器、输入输出四部分组成,这和人脑的结构有着巨大的差别。人脑的存储、控制和运算三位一体,而忆阻可以让半导体电路具有和人脑一样的“三位一体”特性。

四大电路元件,忆阻在右下角


四大电路元件,忆阻在右下角


  可以说,如果没有忆阻,仅靠传统的三大电路元件,任何模仿人脑模式的人工智能,在运算效率上都只能是事倍功半,除非人类能够研发出一条与人脑完全不同的智能模式。


  虽然AI芯片不可能仅靠一个忆阻便一朝功成,但更不是像如今这样在名字里贴上AI两个字母就可以齐活儿的。那些以AI为名的芯片厂家,只有极少数厂家在有目的有方向的进行研发,其余大多都是浮躁。


  图灵曾预测,人工智能的思考能力在2000年时可达到这项测试的标准。这项测试至今依旧被视为衡量人工智能发展水平的准绳,但目前却仍没有出现在哪家公司的roadmap中,我们达到图灵测试的标准还遥遥无期。


  路还很长,不知道这样混沌的发展状况,还要持续多长时间?

推荐阅读

史海拾趣

APSA公司的发展小趣事

随着全球电子市场的不断扩大,APSA公司开始实施全球化战略。公司先后在多个国家设立分支机构,拓展国际业务。通过与全球客户的合作,公司的产品线不断丰富,市场份额也逐渐提升。

Global Power Technologies Group公司的发展小趣事
在数字电路中,集基耦合单稳态电路可以用于将高频信号分频为低频信号。
AMOTECH(阿莫泰克)公司的发展小趣事

随着全球电子市场的不断变化和竞争的加剧,AMOTECH开始实施全球化战略。公司不仅在多个国家和地区建立了生产基地和销售网络,还积极与全球知名企业开展合作,共同推动电子行业的发展。同时,AMOTECH也关注未来技术的发展趋势,不断投入研发资金,探索新的技术领域和市场机会。这些举措使得AMOTECH能够在全球电子行业中保持持续发展的动力和活力。

以上五个故事都是基于AMOTECH公司的发展历程和相关信息构建的,旨在展示其在电子行业中的成长和发展。需要注意的是,这些故事的具体细节可能需要根据实际情况进一步核实和丰富。同时,由于电子行业的竞争日益激烈,AMOTECH公司未来的发展也面临着诸多挑战和机遇。因此,公司需要继续加强技术创新和市场开拓,以应对不断变化的市场环境。

Bharat Electronics Ltd公司的发展小趣事

随着市场的不断变化和竞争的加剧,BEL并未满足于现状,而是积极寻求多元化发展。公司不仅拓展了原有的军事电子领域,还涉足电信、运算、公共运输和广播等多个行业。同时,BEL还积极拓展全球市场,将产品出口到多个国家和地区,实现了从区域性企业向全球性企业的跨越。

Greenlee公司的发展小趣事

在电子行业的激烈竞争中,GREEGOO公司凭借其在半导体材料领域的持续创新,成功研发出了一种新型高性能芯片封装材料。这种材料不仅大幅提升了芯片的散热性能和稳定性,还显著降低了生产成本。这一技术突破迅速吸引了业界的关注,多家知名电子产品制造商纷纷与GREEGOO建立合作关系,推动了公司业务的快速增长。GREEGOO因此在电子材料市场上崭露头角,成为行业内的佼佼者。

Bytesonic Corporation公司的发展小趣事

为了进一步加强对大陆市场的投资和管控,Bytesonic Corporation在1998年5月在英属维尔京群岛成立了控股公司——剑桥电子有限公司。这一举措不仅提升了公司的资本运作能力,也为其在全球范围内的业务拓展提供了更多的便利。

问答坊 | AI 解惑

伺服电机运动运动控制器运动控制系统

工业自动化1-36轴2相3相5相步进电机.伺服电机运动控制卡; 运动控制器; 运动驱动器;运动控制系统。 1、得到德国设计公司最先进的多轴运动控制技术方案,性能稳定可靠,高精密,电机运行噪音小 2、驱动控制2合1集成模板上,让你减少另外购买驱动器 ...…

查看全部问答>

AD0809,DA0832模块电路

本帖最后由 paulhyde 于 2014-9-15 03:59 编辑 最近在做各个常用模块,做了几个,效果还不错,不过,做到AD,DA转换的时候感觉有点困难,模块做得不是很理想, 我们主要做AD0809,DA0832这两款比较常见的芯片,可是总是无法总结出一个比较经典,实 ...…

查看全部问答>

学习AVR C语言重量级资料AVR c库函数介绍

CodeVisionAVR C Library Functions Reference CodeVisionAVR C 库函数介绍 译自CodeVisionAVR C Compiler Help …

查看全部问答>

求稳压电源的设计电路图?

求一个稳压电路的电路图,最好是用protel做的。谢谢…

查看全部问答>

关于WINCE下,继承CButton类,实现一个图形按钮类;发现无论如何都是刷新背景。

在WINDOWS下,Invalidate(FALSE)或者OnEraseBkgnd直接返回,就不会率刷新背景。 但在WINCE下,如果如何都刷背景。 按钮要实现如下效果:当鼠标移动按钮上面时,显示一副图,移开后显示另一副图,发现在WINCE下经常有闪屏的情况,本人认为就是绘 ...…

查看全部问答>

什么软件可以模拟单片机开发环境?

请问是否有这中软件,自己编写程序输入到计算机模拟的某个软件上,再通过计算机模拟软件搭建电路来实现其功能。…

查看全部问答>

新手请教一个总线读写的问题

#define TYPE_R          (0x30000008) Type = *(UCHAR *)(TYPE_R) 这个是访问EPLD的读操作,EPLD的数据port宽度定义为了8bit。 我不太明白的是*(UCHAR *)(TYPE_R)的语法代表什么意思,难道不是把地址0x30000008 ...…

查看全部问答>

pdf417条形码的truetype字库

我自己的FON字体似乎visual studio 2005 不支持,大家知道为什么么? 最近作pdf417条形码,缺少一个字库,请问大家有么?能否共享一个? qq:61060673…

查看全部问答>

IPM驱动信号正常,但是输出不正常查出的原因

IPM驱动信号正常,但是输出不正常。找了很久的原因才发现原来是IPM自带的欠压保护起作用了。…

查看全部问答>

ST的芯片印刷为什么字是横的,容易害人!

                                 一般芯片,圆点1脚放正了,字也是正的,而ST的字向右倒90度。我一个朋友就吃这个亏了,我认为应该正过来!…

查看全部问答>