历史上的今天
返回首页

历史上的今天

今天是:2024年12月04日(星期三)

正在发生

2020年12月04日 | AI革命:算力需求催生芯片创新

2020-12-04 来源:EEWORLD

机器学习已然无处不在。它藏身于很多智能设备中,一部智能手机、一个智能音响、线上购物娱乐的一个个APP里……它像是虚拟世界和物理世界的“缝合者”,用算法和数据试图“猜透”人心。

 

image.png?imageView2/2/w/550


各大厂商对机器学习的热情越来越高,对算法、算力和数据提出新的要求,尤其是对算力需求的激增,进一步催生相关芯片和专用设备的蓬勃创新,而在后摩尔时代,这种创新或将成为突破算力极限的关键。

 

数据“喂”大的机器智能

 

什么是机器学习?简单来说,机器学习使用算法在数据中发现模式,然后使用一个能识别这些模式的模型对新的数据进行预测。

 

由此可见,数据是让一个算法从实验室走到物理世界的关键。数据量、数据多样性以及规模化的、成本可靠的数据来源渠道等都是影响最终结果的关键要素。其中,有一项关键的工作需要大量的人力参与——数据的社会化标注。“某种意义上,机器永远离不开人类。”澳鹏(Appen)中国产品总监张童皓对集微网表示。澳洲公司Appen成立于1996年,多年来一直是AI产业链中比较靠前的数据节点来为客户提供服务,业务涉及提供图像、文本、语音、音频、视频及其他数据收集和标注服务。

 

众所周知,神经网络是当前人工智能发展的基石技术。“神经网络的专长就是在像素点里面尝试着取出一系列的关键点,而这些关键点是由人工标注出来的。”张童皓说,“如果你丢给机器一堆无规则的随机图片,它永远都不知道这个图片里面有人。”

 

随着AI应用要求的不断提升,训练的难度和对数据的要求也随之提升。张童皓告诉集微网,他们曾经为配合一家手机客户的一项算法训练提供数据服务,拍摄全世界各地不同经度、不同纬度的月亮照片。“如果采用在一个国家的不同地方所观察到的月亮,而不是在全球各个地方实地观察,那么其标注的数据一旦应用于全世界数据中,错误的数据将会给后续一系列应用带来错误的结果。”目前Appen的平台上有超过100万名参与人工智能数据收集、标注的人员,他们来自全球130个国家或地区的7万多个地方,涵盖180 多种语言和方言。

 

机器对数据的“胃口”越来越越大。以谷歌的BERT为例,这是该公司2018年建立并用于其搜索引擎的AI语言模型,它具有超过3.5亿个内部参数,使用33亿个文字单词进行了训练,大部分来自在线的维基百科。而研究人员称,如果可以用更大的数据量,比如300亿个单词训练一个系统,那么它的性能显然将更好。而更多的数据意味着需要更多的计算能力来处理这一切。

 

算力需求激增 催生芯片创新

 

据《经济学人》统计,从2012年到2018年,用于训练大型模型的计算能力已增长了30万倍,并且约每三个半月翻一番。值得注意的是,支持这一发展速度需要的远不止摩尔定律所能实现的改进。更何况如今正值摩尔定律走向枯竭之际,如何不断提升系统性能以满足人工智能训练的需求?后摩尔时代的AI革命显然需要新的颠覆——从计算架构开始,做算法、硬件和软件的共同优化变得尤为关键。

 

对算力需求的激增,也进一步催生AI专用芯片和专用设备的蓬勃发展,并促使芯片层面的多种创新。

 

张童皓也观察到了芯片技术和机器学习之前的相互影响。他指出,基于机器学习的芯片架构发展,已经从最初的硬件通用化到场景定制化服务,“很多AI行业的领头羊在特定芯片模组上的投入,都是在服务AI场景化落地。”

 

比如,苹果的自研芯片里有一个专门用于机器学习的处理器——神经引擎,它和CPU、GPU一起处理机器学习所需要的大量的运算。据苹果公司全球副总裁葛越在今年上海的世界人工智能大会上透露,该神经引擎每秒钟可以完成高达五万亿次的运算。此外,谷歌自行设计了TPU(张量处理单元)芯片,百度自行开发的AI芯片“昆仑”。英特尔则在去年12月以20亿美元收购了以色列公司哈瓦那实验室(Habana Labs),该公司的云端AI推理芯片已经商用。成立于2016年的英国公司Graphcore则正在开发一种新型处理器——IPU(intelligent processing unit,智能处理器),可以帮助加速机器智能产品和服务的开发,该公司2019年的估值已达到20亿美元。

 

此类创新将变得越来越重要,因为AI引发的计算能力需求的激增正值摩尔定律逐渐枯竭之际——在过去50年里,传统数字计算机的性能按照摩尔定律一路提升——集成电路(微芯片)的容量大约每18-24个月翻一番。如今,数字计算机性能的发展速度似乎正在放慢。

 

突破摩尔定律的尝试

 

摩尔定律和冯诺依曼架构的瓶颈在算力需求激增之下日益凸显。寻找新的替代方案突破蛮力计算变得尤为重要。

 

复旦大学信息学院研究员、新氦类脑智能首席科学家邹卓教授指出,摩尔定律的挑战在于——无法承受的能耗密度,原子尺度的尺寸、制程、器件的不稳定性和偏差,以及比例缩小并没有带来实质性的性能提升,高昂的研发和制造成本。与此同时,冯诺依曼计算架构不断抵近极限,即内存的读取速度和芯片的处理速度渐渐难以实现同步。

 

量子计算是一种解决方式——利用量子力学的反直觉特性来大幅加速某些类型的计算。比如,微软研究院量子架构与计算小组负责人提出一种称为葛洛沃算法(Grover's algorithm)的量子计算技术,该技术有望大大提高计算速度。因为关于机器学习的一种思考方式是将其视作优化问题,即计算机试图在数百万个变量之间折中取舍,以求出误差尽可能小的解

 

另一种思路则是从生物学中得到启发。这个领域以大脑的神经网络架构为基础开发下一代计算机。神经形态计算聚焦脉冲神经网络(spiking neural network,SNN)被业界称作第三代神经网络

 

“生物是很高效的计算系统。”邹卓指出,借助类脑技术大规模并行、事件驱动、实施环境交互、感算存紧密耦合协同等特点,开发能够如人脑般感知、传递、处理和运用信息的智能芯片与系统,有望突破摩尔定律以及冯诺依曼架构的瓶颈。

 

“像人脑一样的存算一体,打破了传统冯诺依曼架构存储计算分离的架构,这是类脑计算的核心突破。”新氦类脑智能企业战略总监程韫韵对集微网解释,存算一体的模式,即把内存和计算单元两者作为一个单元,不会因计算任务的架构复杂化而功耗激增,这也让计算耗电和散热两大难题找到了新的方向。

 

Facebook内部做过一项统计,其AI负责人曾透露,该公司那些最大型的模型进行一轮训练可能需要耗费数百万美元的电力。相比之下,同样的情况人脑消耗的能量可能仅需其千分之一。

 

看起来,这似乎在突破蛮力计算上充满潜力,近年来不少科技公司也都涉足研究“神经形态”芯片。

 

2011年,IBM发布了TrueNorth芯片。2014年TrueNorth更新了第二代,功耗达到了平方厘米消耗20毫瓦,印证了类脑芯片的低功耗价值,也在一些AI任务上印证了类脑芯片的实际工作能力。紧随其后的是英特尔。2017年,英特尔发布了类脑芯片Loihi,其拥有13万个人造突触。2019年7月,英特尔又发布了首个大规模神经形态计算系统Pohoiki Beach。该系统由64块Loihi组合而成,可以在自动导航、陆续规划等需要高效执行的AI任务中带来高于GPU的功耗和处理能力。此外,高通也开发过名为Zeroth的类脑芯片。中国业界在该领域也加紧投入,如浙大的“达尔文”芯片、清华的“天机”芯片等都已在路上。其中清华的“天机”芯片作为全球首款异构融合类脑芯片去年登上了《自然》(Nature)杂志封面。

 

但需要指出的是,这一切都尚未成熟。量子计算的应用落地还面临很多工程设计问题。类脑智能层面,一方面科学家仍然不完全了解大脑究竟是怎么工作的,另一方面适配类脑计算的架构、算法、编程方案等等也处在广泛的空白期。

 

显然,找到绕开比特编程和摩尔定律的替代方案,并使之从实验室步入现实世界,还有很长的路要走。

推荐阅读

史海拾趣

FINTEK公司的发展小趣事

随着ASP芯片市场的成功,FINTEK公司意识到单一产品线的局限性。为了保持竞争优势并开拓新市场,公司开始多元化拓展产品线。经过市场调研和技术储备,FINTEK相继推出了数字信号处理器(DSP)、微控制器(MCU)以及射频前端模块(RF FEM)等一系列新产品。这些产品的推出不仅丰富了公司的产品线,也进一步巩固了FINTEK在半导体领域的市场地位。

Don Connex Electronics Co Ltd公司的发展小趣事

Don Connex Electronics始终将研发创新作为公司的核心竞争力。公司每年将大量资金投入到新技术、新产品的研发中,不断推出具有市场竞争力的产品。同时,公司还积极与高校、科研机构合作,引进高端人才,加强技术研发力量。这些举措使Don Connex Electronics在激烈的市场竞争中始终保持领先地位。

AZ Displays公司的发展小趣事

随着技术的不断进步和市场需求的不断变化,AZ Displays的产品应用领域也在不断拓展。除了传统的消费电子领域外,公司的产品还广泛应用于航空电子、医疗、导航系统、工业控制等多个领域。通过与各行业合作伙伴的紧密合作,AZ Displays成功打开了新的市场大门,实现了业务的快速增长。

AAT [Advanced Analog Technology, Inc.]公司的发展小趣事

AZ Displays深知品质是企业生存的根本。因此,公司始终将质量控制放在首位,从原材料采购到生产工艺的每一个环节都进行严格把控。通过严格的质量管理体系和高效的供应链管理,AZ Displays的产品质量得到了客户的高度认可,逐渐在行业内建立了卓越的声誉。

ELM Technology Corporation公司的发展小趣事

ELM Technology Corporation一直将产品质量视为企业的生命线。公司建立了严格的质量管理体系,从原材料采购到产品生产的每一个环节都进行严格把控。这种对品质的坚持不仅赢得了客户的信任,还为ELM赢得了良好的口碑。在激烈的市场竞争中,ELM凭借卓越的产品品质赢得了市场份额。

深圳杜因特(DOINGTER)公司的发展小趣事

在竞争激烈的电子行业中,杜因特始终将创新作为公司发展的核心动力。公司不断投入大量资源进行新产品的研发和技术创新,特别是在Super-Junction MOSFET和Super-Trench MOSFET等高端产品领域取得了显著成果。这些创新产品不仅满足了市场对高品质MOSFET的日益增长需求,还进一步巩固了杜因特在电子行业的技术领先地位。

问答坊 | AI 解惑

关于视频系统处理器选择的建议

关于视频系统处理器选择的建议基于ARM核心的Freescale的i.MX系列芯片是视频应用的佼佼者。 比如i.MX27和i.MX31 i.MX27嵌入式开发板是高清视频输入输出的首选,i.mx27芯片提供了更高的灵活性和更强大的多媒体处理能力,成为IP视频和语音(V2IP)、移 ...…

查看全部问答>

关于7行5列LED键盘指示灯的编程,请高手解惑!十万火急!万分感谢!

7行5列的LED键盘指示灯,键按下时相应的LED指示灯也会亮! 灯亮的原则:列为高电平,行为低电平。 我想问的是,如果我知道了第0行第0列的键按下了,想要第0行第0列的灯亮,那么是不是应该让列所在的存储器第0位置1,其余列置0!即将0x01输入到相 ...…

查看全部问答>

自制超级流水灯演示板

单片机的用途非常广阔,各种智能控制的产品中都少不了它的身影,前景看好,因此引起了一阵阵学习单片机的热潮。   相信很多初学单片机的朋友都是从做流水灯开始的,因为流水灯的电路较为简单。看着按照自己的设想做成的流水灯变幻着不同的花样, ...…

查看全部问答>

ARM板上如何增加显卡芯片

如题, 望版主推荐 一直以来,因ARM开发板每次换屏的时候都要重新生成NK,有没人做过在板子上驱动一个显卡IC来驱动LCD? 如果有,IC型号大家了解的有哪些? 如果增加了这个显卡IC,那么原来的Display驱动还要不要? 大家一起讨论讨论,突然想 ...…

查看全部问答>

谁能详细讲讲 uboot smdk2410.h 里面配置信息的含义?

谢谢! 我是初学者,不明白里面都在配置些什么,不明白哪些是最重要的。…

查看全部问答>

关于vs2005开发windows ce 5程序部署到机器的问题

1:首先非常感谢您的帮助,同时我找遍了google和baidu,没有找到,或许是关键字搜索的不好。所以来此提问。 2:问题描述如下    机器是广州市微嵌计算机科技的Arm9 的硬件系统,采用的是windows ce 5.0。该设备有一个特点是会将hwDir目 ...…

查看全部问答>

如何使程序某个功能运行时不响应其它操作

小弟要实现如下功能: 当我点击打印操作时,程序弹出一个对话框,显示正在打印,在打印的过程中,必须使程序无法响应用户的其它任何操作。当打印结束时,显示打印成功或打印失败,然后才让程序可以继续响应用户其它操作。 请问这个如何解决哈? …

查看全部问答>

讨论: 用fread, fwrite存取结构数据安全吗?

同样的软件,平时都用的好好的,但有半天fread出来的数据都不对。于是才产生这个疑问.…

查看全部问答>

压力传感器在汽车空调系统中是如何应用的?

在汽车空调系统中,压力传感器都应用在那部分,又是给那里提供数据,这些数据的作用。请各位大侠指点指点。谢谢!…

查看全部问答>