历史上的今天
返回首页

历史上的今天

今天是:2025年01月15日(星期三)

正在发生

2018年01月15日 | 人工智能芯片到底有何不同?

2018-01-15 来源:ofweek

  2018年1月9日,全球规模最大的2018北美消费电子产品展在美国拉斯维加斯拉开帷幕。本次参展的科技企业超过4000家,包括高通、英伟达、英特尔、LG、IBM、百度在内的业界科技巨头纷纷发布了各自最新的人工智能芯片产品和战略,作为本届展会的最大看点,人工智能芯片产品无疑受到了最为广泛的关注。

  与CPU比较,人工智能芯片有何不同?

  2017年,当AlphaGo在围棋大战中完胜柯洁后,各大媒体对人工智能的讨论就不绝于耳,甚至有人担心机器会具备自主思维,终有一天会像电影《终结者》中的场景一样对人类造成生存威胁。不管这种危机是否存在,但必须认识到人工智能芯片在架构和功能特点上与传统的CPU是有着非常大的区别。

  传统的CPU运行的所有的软件是由程序员编写,完成的固化的功能操作。其计算过程主要体现在执行指令这个环节。但与传统的计算模式不同,人工智能要模仿的是人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。它不需要人为的提取所需解决问题的特征或者总结规律来进行编程。

  人工智能是在大量的样本数据基础上,通过神经网络算法训练数据,建立了输入数据和输出数据之间的映射关系,其最直接的应用是在分类识别方面。例如训练样本的输入是语音数据,训练后的神经网络实现的功能就是语音识别,如果训练样本输入是人脸图像数据,训练后实现的功能就是人脸识别。

  

  通常来说,人工智能包括机器学习和深度学习,但不管是机器学习还是深度学习都需要构建算法和模式,以实现对数据样本的反复运算和训练,降低对人工理解功能原理的要求。因此,人工智能芯片需要具备高性能的并行计算能力,同时要能支持当前的各种人工神经网络算法。传统CPU由于计算能力弱,支撑深度学习的海量数据并行运算,且串行的内部结构设计架构为的是以软件编程的方式实现设定的功能,并不适合应用于人工神经网络算法的自主迭代运算。传统CPU架构往往需要数百甚至上千条指令才能完成一个神经元的处理,在AI芯片上可能只需要一条指令就能完成。

  解读主流的人工智能芯片

  人工智能的高级阶段是深度学习,而对于深度学习过程则可分为训练和推断两个环节:训练环节通常需要通过大量的数据输入或采取增强学习等非监督学习方法,训练出一个复杂的深度神经网络模型。训练过程由于涉及海量的训练数据和复杂的深度神经网络结构,需要的计算规模非常庞大,通常需要GPU集群训练几天甚至数周的时间,在训练环节GPU目前暂时扮演着难以轻易替代的角色。推断环节指利用训练好的模型,使用新的数据去“推断”出各种结论,如视频监控设备通过后台的深度神经网络模型,判断一张抓拍到的人脸是否属于黑名单。虽然推断环节的计算量相比训练环节少,但仍然涉及大量的矩阵运算。

  在推断环节,除了使用CPU或GPU进行运算外,FPGA以及ASIC均能发挥重大作用。目前,主流的人工智能芯片基本都是以GPU、FPGA、ASIC以及类脑芯片为主。

  1.FPGA

  即专用集成电路,一种集成大量基本门电路及存储器的芯片,可通过烧入FPGA配置文件来来定义这些门电路及存储器间的连线,从而实现特定的功能。而且烧入的内容是可配置的,通过配置特定的文件可将FPGA转变为不同的处理器,就如一块可重复刷写的白板一样。FPGA有低延迟的特点,非常适合在推断环节支撑海量的用户实时计算请求,如语音识别。由于FPGA适合用于低延迟的流式计算密集型任务处理,意味着FPGA芯片做面向与海量用户高并发的云端推断,相比GPU具备更低计算延迟的优势,能够提供更佳的消费者体验。在这个领域,主流的厂商包括Intel、亚马逊、百度、微软和阿里云。

  2.ASIC

  即专用集成电路,不可配置的高度定制专用芯片。特点是需要大量的研发投入,如果不能保证出货量其单颗成本难以下降,而且芯片的功能一旦流片后则无更改余地,若市场深度学习方向一旦改变,ASIC前期投入将无法回收,意味着ASIC具有较大的市场风险。但ASIC作为专用芯片性能高于FPGA,如能实现高出货量,其单颗成本可做到远低于FPGA。

  谷歌推出的TPU就是一款针对深度学习加速的ASIC芯片,而且TPU被安装到AlphaGo系统中。但谷歌推出的第一代TPU仅能用于推断,不可用于训练模型,但随着TPU2.0的发布,新一代TPU除了可以支持推断以外,还能高效支持训练环节的深度网络加速。根据谷歌披露的测试数据,谷歌在自身的深度学习翻译模型的实践中,如果在32块顶级GPU上并行训练,需要一整天的训练时间,而在TPU2.0上,八分之一个TPUPod(TPU集群,每64个TPU组成一个Pod)就能在6个小时内完成同样的训练任务。

  3.GPU

  即图形处理器。最初是用在个人电脑、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,可以快速地处理图像上的每一个像素点。后来科学家发现,其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习。2011年吴恩达教授率先将其应用于谷歌大脑中便取得惊人效果,结果表明,12颗英伟达的GPU可以提供相当于2000颗CPU的深度学习性能,之后纽约大学、多伦多大学以及瑞士人工智能实验室的研究人员纷纷在GPU上加速其深度神经网络。

  GPU之所以会被选为超算的硬件,是因为目前要求最高的计算问题正好非常适合并行执行。一个主要的例子就是深度学习,这是人工智能(AI)最先进的领域。深度学习以神经网络为基础。神经网络是巨大的网状结构,其中的节点连接非常复杂。训练一个神经网络学习,很像我们大脑在学习时,建立和增强神经元之间的联系。从计算的角度说,这个学习过程可以是并行的,因此它可以用GPU硬件来加速。这种机器学习需要的例子数量很多,同样也可以用并行计算来加速。在GPU上进行的神经网络训练能比CPU系统快许多倍。目前,全球70%的GPU芯片市场都被NVIDIA占据,包括谷歌、微软、亚马逊等巨头也通过购买NVIDIA的GPU产品扩大自己数据中心的AI计算能力。

  4.类人脑芯片

  类人脑芯片架构是一款模拟人脑的新型芯片编程架构,这种芯片的功能类似于大脑的神经突触,处理器类似于神经元,而其通讯系统类似于神经纤维,可以允许开发者为类人脑芯片设计应用程序。通过这种神经元网络系统,计算机可以感知、记忆和处理大量不同的情况。

  IBM的TrueNorth芯片就是其中一个。2014年,IBM首次推出了TrueNorth类人脑芯片,这款芯片集合了54亿个晶体管,构成了一个有100万个模拟神经元的网络,这些神经元由数量庞大的模拟神经突触动相连接。TrueNorth处理能力相当于1600万个神经元和40亿个神经突触,在执行图象识别与综合感官处理等复杂认知任务时,效率要远远高于传统芯片。


推荐阅读

史海拾趣

Geo Semiconductor Inc公司的发展小趣事
通过合理的布线、使用屏蔽线、加装滤波器等措施,减少外部电磁干扰对控制电路的影响。
Herley New York公司的发展小趣事
采用更先进的微处理器或PLC(可编程逻辑控制器)作为控制核心,以提高控制精度和响应速度。
台湾兆欣(EMTEK)公司的发展小趣事

在立足台湾市场的同时,兆欣也积极拓展海外市场。他们通过参加国际展会、与海外客户建立合作关系等方式,成功将产品打入国际市场。特别是在亚洲地区,兆欣的产品受到了广泛欢迎和认可。这种多元化的市场布局为公司的快速发展提供了有力支持。

FSP [FSP TECHNOLOGY INC.]公司的发展小趣事

随着电子产品的不断小型化和集成化,兆欣面临着越来越大的技术挑战。然而,他们并没有退缩,反而加大了研发投入。经过无数次试验和改进,兆欣成功开发出全自动薄型功率电感,这一产品在市场上引起了广泛关注。同时,他们还针对USB3.0的市场趋势,预计导入相关对应产品,为公司的未来发展奠定了坚实基础。

Compensated Devices Inc公司的发展小趣事

Compensated Devices Inc(简称CDI)最初是一家小型电子元件制造商,专注于生产高精度电阻器。随着科技的飞速发展,传统电阻器已无法满足新兴市场的需求。CDI的创始人李先生敏锐地洞察到这一点,决定投入大量资源进行研发,推出了具有温度补偿和自动校准功能的新型电阻器。这一创新产品迅速获得了市场的认可,CDI也因此逐渐在电子行业中崭露头角。

Elpida Memory公司的发展小趣事

尽管有政府的支持,但Elpida Memory的经营状况并未得到根本性的改善。在经历了多年的亏损和重组后,Elpida Memory最终于2012年被美国的美光科技(Micron Technology)收购。这一收购标志着Elpida Memory正式退出了日本半导体产业的舞台,但也为其未来的发展提供了新的机遇。

问答坊 | AI 解惑

步进电机在高精度位置控制系统中的应用

步进电机是 1 种将数字脉冲信号转换成机械角位移或线位移的数模转换元件.研究了 1 种基于 PWM 的连续多倍细分控制的步进电机驱动方法 ,该方法可有效地提高位置控制精度.…

查看全部问答>

一个电子工程师的经验之谈

“工程师是科学家;工程师是艺术家;工程师也是思想家。”一位伟大的工程师曾经提出过这样的一段感言。不错,工程师是利用自然科学来创造工程的人。工程既是物质的也是思想上的。许多不朽的工程,伟大的发明以及出神入化的技术方案,许多人往往只看 ...…

查看全部问答>

谁有NEC-78KOS系列的中文资料上传一点

谁有NEC-78KO系列的中文资料上传一点,谢谢啦…

查看全部问答>

低抖动的鉴频鉴相器设计

本帖最后由 paulhyde 于 2014-9-15 09:11 编辑 低抖动的鉴频鉴相器设计  …

查看全部问答>

产生发明创造的12种方法

世界上一些伟在的发明创造是怎么来的,有人给总结了一下大至有以下几点   1、偶然发现法 一些发明或许就是偶然的发现,如果不去思考,偶然的发现就会滑过去,什么结果也没有,现实生活中的所有现象都有它的道理,偶然出现的事物也有它的道理 ...…

查看全部问答>

ZigBee求救~

刚弄不长时间的ZigBee,协议也仅仅把APL和NWKL简单看了看,IEEE802.15.4还没看~ 协议栈用的TI的Z-stack~ 组网试验定位试验都作过了~ 可现在的需求是要求串行传输数据,也就是一个接一个的接力传输,不知道如何下手了,Z-stack基本上没怎么看~ ...…

查看全部问答>

求个电源指示灯电路

想做个电源指示灯电路,发现自己做的行不通。 条件:电源电压+5V,红色发光二极管,或非门。 要求:电源电量足,指示灯不亮,电源不足,指示灯亮。 不知道在这样的条件下,还可以实现?…

查看全部问答>

急求ccs无法打开的问题

我们设计了一个视频系统。目前只把电源芯片 dsp sdram和flash以及他们所需的周边器件,电压已经满足要求,也有时钟信号,复位电平始终为高,但是当连接后ccs无法打开,不知道是什么问题,清高受指点。…

查看全部问答>

MSP430超声波测距

因为需要涉及到使用超声波测距的方法,在网上搜了一下,发觉又成熟的方案,分享给大家一下…

查看全部问答>

谁能帮我看看这个2812SCI小程序,一直弄不对

#include \"DSP28_Device.h\" #include \"DSP28_Sci.h\" unsigned int y[3]; int i,j; void main() {         /*初始化*/         InitSysCtrl();         DINT;   &nb ...…

查看全部问答>