历史上的今天
返回首页

历史上的今天

今天是:2024年12月04日(星期三)

正在发生

2020年12月04日 | 后摩尔时代的AI革命:算力需求巨增,催生芯片创新

2020-12-04 来源:爱集微

机器学习已然无处不在。它藏身于很多智能设备中,一部智能手机、一个智能音响、线上购物娱乐的一个个APP里……它像是虚拟世界和物理世界的“缝合者”,用算法和数据试图“猜透”人心。

各大厂商对机器学习的热情越来越高,对算法、算力和数据提出新的要求,尤其是对算力需求的激增,进一步催生相关芯片和专用设备的蓬勃创新,而在后摩尔时代,这种创新或将成为突破算力极限的关键。

数据“喂”大的机器智能

什么是机器学习?简单来说,机器学习使用算法在数据中发现模式,然后使用一个能识别这些模式的模型对新的数据进行预测。

由此可见,数据是让一个算法从实验室走到物理世界的关键。数据量、数据多样性以及规模化的、成本可靠的数据来源渠道等都是影响最终结果的关键要素。其中,有一项关键的工作需要大量的人力参与——数据的社会化标注。“某种意义上,机器永远离不开人类。”澳鹏(Appen)中国产品总监张童皓对集微网表示。澳洲公司Appen成立于1996年,多年来一直是AI产业链中比较靠前的数据节点来为客户提供服务,业务涉及提供图像、文本、语音、音频、视频及其他数据收集和标注服务。

众所周知,神经网络是当前人工智能发展的基石技术。“神经网络的专长就是在像素点里面尝试着取出一系列的关键点,而这些关键点是由人工标注出来的。”张童皓说,“如果你丢给机器一堆无规则的随机图片,它永远都不知道这个图片里面有人。”

随着AI应用要求的不断提升,训练的难度和对数据的要求也随之提升。张童皓告诉集微网,他们曾经为配合一家手机客户的一项算法训练提供数据服务,拍摄全世界各地不同经度、不同纬度的月亮照片。“如果采用在一个国家的不同地方所观察到的月亮,而不是在全球各个地方实地观察,那么其标注的数据一旦应用于全世界数据中,错误的数据将会给后续一系列应用带来错误的结果。”目前Appen的平台上有超过100万名参与人工智能数据收集、标注的人员,他们来自全球130个国家或地区的7万多个地方,涵盖180 多种语言和方言。

机器对数据的“胃口”越来越越大。以谷歌的BERT为例,这是该公司2018年建立并用于其搜索引擎的AI语言模型,它具有超过3.5亿个内部参数,使用33亿个文字单词进行了训练,大部分来自在线的维基百科。而研究人员称,如果可以用更大的数据量,比如300亿个单词训练一个系统,那么它的性能显然将更好。而更多的数据意味着需要更多的计算能力来处理这一切。

算力需求激增 催生芯片创新

据《经济学人》统计,从2012年到2018年,用于训练大型模型的计算能力已增长了30万倍,并且约每三个半月翻一番。值得注意的是,支持这一发展速度需要的远不止摩尔定律所能实现的改进。更何况如今正值摩尔定律走向枯竭之际,如何不断提升系统性能以满足人工智能训练的需求?后摩尔时代的AI革命显然需要新的颠覆——从计算架构开始,做算法、硬件和软件的共同优化变得尤为关键。

对算力需求的激增,也进一步催生AI专用芯片和专用设备的蓬勃发展,并促使芯片层面的多种创新。

张童皓也观察到了芯片技术和机器学习之前的相互影响。他指出,基于机器学习的芯片架构发展,已经从最初的硬件通用化到场景定制化服务,“很多AI行业的领头羊在特定芯片模组上的投入,都是在服务AI场景化落地。”

比如,苹果的自研芯片里有一个专门用于机器学习的处理器——神经引擎,它和CPU、GPU一起处理机器学习所需要的大量的运算。据苹果公司全球副总裁葛越在今年上海的世界人工智能大会上透露,该神经引擎每秒钟可以完成高达五万亿次的运算。此外,谷歌自行设计了TPU(张量处理单元)芯片,百度自行开发的AI芯片“昆仑”。英特尔则在去年12月以20亿美元收购了以色列公司哈瓦那实验室(Habana Labs),该公司的云端AI推理芯片已经商用。成立于2016年的英国公司Graphcore则正在开发一种新型处理器——IPU(intelligent processing unit,智能处理器),可以帮助加速机器智能产品和服务的开发,该公司2019年的估值已达到20亿美元。

此类创新将变得越来越重要,因为AI引发的计算能力需求的激增正值摩尔定律逐渐枯竭之际——在过去50年里,传统数字计算机的性能按照摩尔定律一路提升——集成电路(微芯片)的容量大约每18-24个月翻一番。如今,数字计算机性能的发展速度似乎正在放慢。

突破摩尔定律的尝试

摩尔定律和冯诺依曼架构的瓶颈在算力需求激增之下日益凸显。寻找新的替代方案突破蛮力计算变得尤为重要。

复旦大学信息学院研究员、新氦类脑智能首席科学家邹卓教授指出,摩尔定律的挑战在于——无法承受的能耗密度,原子尺度的尺寸、制程、器件的不稳定性和偏差,以及比例缩小并没有带来实质性的性能提升,高昂的研发和制造成本。与此同时,冯诺依曼计算架构不断抵近极限,即内存的读取速度和芯片的处理速度渐渐难以实现同步。

量子计算是一种解决方式——利用量子力学的反直觉特性来大幅加速某些类型的计算。比如,微软研究院量子架构与计算小组负责人提出一种称为葛洛沃算法(Grover's algorithm)的量子计算技术,该技术有望大大提高计算速度。因为关于机器学习的一种思考方式是将其视作优化问题,即计算机试图在数百万个变量之间折中取舍,以求出误差尽可能小的解

另一种思路则是从生物学中得到启发。这个领域以大脑的神经网络架构为基础开发下一代计算机。神经形态计算聚焦脉冲神经网络(spiking neural network,SNN)被业界称作第三代神经网络

“生物是很高效的计算系统。”邹卓指出,借助类脑技术大规模并行、事件驱动、实施环境交互、感算存紧密耦合协同等特点,开发能够如人脑般感知、传递、处理和运用信息的智能芯片与系统,有望突破摩尔定律以及冯诺依曼架构的瓶颈。

“像人脑一样的存算一体,打破了传统冯诺依曼架构存储计算分离的架构,这是类脑计算的核心突破。”新氦类脑智能企业战略总监程韫韵对集微网解释,存算一体的模式,即把内存和计算单元两者作为一个单元,不会因计算任务的架构复杂化而功耗激增,这也让计算耗电和散热两大难题找到了新的方向。

Facebook内部做过一项统计,其AI负责人曾透露,该公司那些最大型的模型进行一轮训练可能需要耗费数百万美元的电力。相比之下,同样的情况人脑消耗的能量可能仅需其千分之一。

看起来,这似乎在突破蛮力计算上充满潜力,近年来不少科技公司也都涉足研究“神经形态”芯片。

2011年,IBM发布了TrueNorth芯片。2014年TrueNorth更新了第二代,功耗达到了平方厘米消耗20毫瓦,印证了类脑芯片的低功耗价值,也在一些AI任务上印证了类脑芯片的实际工作能力。紧随其后的是英特尔。2017年,英特尔发布了类脑芯片Loihi,其拥有13万个人造突触。2019年7月,英特尔又发布了首个大规模神经形态计算系统Pohoiki Beach。该系统由64块Loihi组合而成,可以在自动导航、陆续规划等需要高效执行的AI任务中带来高于GPU的功耗和处理能力。此外,高通也开发过名为Zeroth的类脑芯片。中国业界在该领域也加紧投入,如浙大的“达尔文”芯片、清华的“天机”芯片等都已在路上。其中清华的“天机”芯片作为全球首款异构融合类脑芯片去年登上了《自然》(Nature)杂志封面。

但需要指出的是,这一切都尚未成熟。量子计算的应用落地还面临很多工程设计问题。类脑智能层面,一方面科学家仍然不完全了解大脑究竟是怎么工作的,另一方面适配类脑计算的架构、算法、编程方案等等也处在广泛的空白期。

显然,找到绕开比特编程和摩尔定律的替代方案,并使之从实验室步入现实世界,还有很长的路要走。


AI
推荐阅读

史海拾趣

Fine Products Microelectronics Corp公司的发展小趣事

Fine Products Microelectronics Corp公司发展故事(虚构)

故事一:技术创新引领市场

Fine Products Microelectronics Corp(简称FPMC)自创立之初便致力于半导体技术的创新。在上世纪90年代,当半导体行业还普遍使用传统光刻技术时,FPMC的研发团队率先提出了步进式光刻机(Wafer Stepper)的概念。这一创新极大地提高了芯片制造的精度和效率,使得芯片特征尺寸得以大幅缩小。尽管初期面临技术难度大、市场接受度低等挑战,但FPMC凭借坚持不懈的努力,最终成功研发出并量产了步进式光刻机,迅速在半导体制造领域占据了领先地位。

故事二:与巨头的合作与竞争

在FPMC的成长过程中,与行业内巨头的合作与竞争是不可或缺的一部分。特别是在21世纪初,FPMC与IBM、TI等知名企业建立了合作关系,共同推进半导体技术的研发和应用。然而,这种合作并非一帆风顺,FPMC在某些关键技术上坚持自主研发,与IBM的电子束光刻(e-beam)技术产生了竞争。尽管这种竞争给FPMC带来了一定的压力,但也促使公司不断加大研发投入,提升技术实力,最终形成了自己独特的竞争优势。

故事三:石墨烯电极技术的突破

近年来,随着二维材料研究的兴起,FPMC紧跟科技前沿,成功研发出了石墨烯辅助金属电极转印技术。这一技术利用石墨烯与金属间较弱的范德华作用力,实现了金属电极阵列在二维沟道材料上的无损转移。该技术不仅提高了电极的制备精度和效率,还降低了制造成本,为二维芯片的应用开辟了新的路径。FPMC的这一创新成果迅速获得了业界的关注和认可,进一步巩固了公司在半导体材料领域的领先地位。

故事四:物联网时代的布局

随着物联网技术的快速发展,FPMC敏锐地捕捉到了这一市场机遇。公司及时调整战略方向,加大了对物联网相关产品的研发力度。通过与多家物联网企业和研究机构的合作,FPMC成功推出了一系列高性能、低功耗的物联网芯片和解决方案。这些产品广泛应用于智能家居、智慧城市、工业控制等领域,为物联网的普及和发展提供了强有力的支持。

故事五:绿色可持续发展

在追求技术创新和市场拓展的同时,FPMC始终不忘企业的社会责任。公司积极响应全球绿色可持续发展的号召,致力于研发环保型半导体产品和制造工艺。通过采用先进的节能减排技术和循环利用材料等手段,FPMC不仅降低了自身的生产成本和能耗水平,还为推动半导体行业的绿色可持续发展做出了积极贡献。此外,公司还积极参与社会公益活动,为构建和谐社会贡献自己的一份力量。

静芯微电子(ElecSuper)公司的发展小趣事

随着技术的不断进步和市场需求的不断变化,静芯微电子开始拓展产品线。公司不仅继续深耕ESD/TVS领域,还逐渐涉足了RS485、HALL、电源、接口等芯片的研发和生产。这些新产品的推出不仅丰富了公司的产品线,还进一步扩大了静芯微电子在电子行业的应用范围。目前,静芯微电子的产品已经广泛应用于汽车电子、工业控制、消费电子等领域,并与多家知名品牌建立了深度合作。

Comtronic Gmbh-Verbindungstechnik公司的发展小趣事

静芯微电子在发展过程中,持续投入研发资源,不断推动技术创新。公司成功研发出芯片级TVS器件,并在国内首次开发成功在人体模型(HBM)下抗静电强度高于30KV的关键技术和器件。这一技术突破不仅提升了产品的性能,还进一步巩固了静芯微电子在ESD/TVS领域的领先地位。同时,公司还积极申请和积累专利,目前已拥有多项发明专利、实用新型专利和集成电路布图登记等知识产权成果。

Hi-Tech Resistors Pvt Ltd公司的发展小趣事

静芯微电子深知产品质量对于企业的重要性,因此建立了完善的质量管理体系。公司从原材料采购、生产制造到产品检测等各个环节都实行严格的质量控制和管理,确保每一款产品都符合高标准的质量要求。同时,静芯微电子还引进了先进的检测设备和技术手段,对产品质量进行全面检测和评估。这些措施保证了静芯微电子产品的稳定性和可靠性,赢得了客户的信任和好评。

ERA Transformers公司的发展小趣事

随着技术的不断进步,ERA Transformers公司的产品逐渐受到了业界的广泛关注。一次,一家国际知名的电子设备制造商找到他们,希望合作开发一款适用于其新产品的变压器。这对ERA Transformers公司来说是一个难得的机会,也是一个巨大的挑战。公司迅速组织技术团队,与这家制造商紧密合作,经过数轮的设计、测试和修改,最终成功研发出了一款完全符合客户要求的高性能变压器。这一成功合作不仅为公司带来了可观的收益,更赢得了客户的极高评价和长期合作意向。

Esc Electronics Corp公司的发展小趣事

面对电子行业技术的快速迭代和市场竞争的加剧,Esc始终保持创新驱动的发展策略。公司不断加大对研发创新的投入力度,推动产品升级和产业升级。通过引入新技术、新工艺和新材料,Esc成功开发出一系列具有竞争力的新产品,并在市场上取得了显著的成绩。同时,公司还积极参与行业标准的制定和推广工作,推动整个电子行业的进步和发展。

问答坊 | AI 解惑

新能源车遇“电磁危机” 安全遭质疑

来自北美混合动力车车主们的投诉,使混合动力等电动汽车遇到了一场信任危机。   危机来自一向非常关注自身权益的北美消费者,一些混合动力车的消费者声称,他们车内的电磁辐射问题较为严重,甚至引发身体不适。加拿大的一家监测机构也表示,他 ...…

查看全部问答>

请问:各位用 camera 抓回来的视频信号的 [显示效果] 怎么样啊?

我用的2440camera抓回来的视频信号(模拟转为数字)显示效果很差: 用灰阶测试,其中有一格偏暗的效果最差,有明显的横的一块一块的东西,其他的则还相对较好 之前一直觉得是视频AD这边的问题,对AD芯片的地、电源都作过处理,但效果不明显 请教 ...…

查看全部问答>

NAND Flash的名字可以修改名称吗

在注册表里面把NAND Flash文件夹的名称全部修改后,打开资源管理器发现NAND Flash的名字并没有有改,不通过修改bsp可以修改名称吗?…

查看全部问答>

USB网卡驱动与ADSL问题

USB网卡在局域网和通过路由器,交换机上外网时都很正常。就是通过ADSL拨号时,发现速度超慢,发现是通过路由器(交换机)时的速度的十分之一,现在怀疑时我自己写的驱动的问题,请问各位大侠:在用ADSL进行拨号时,驱动程序方面需要注意点什么??? ...…

查看全部问答>

偶的程序出了點問題,不知道怎么回事(單片機的C)

51單片機寫9850控制字的子程序如下: void dds9850_w(void) {     extern num_input;     uint ret,i,tw;     uchar xdata *addr = DDS1_FRQ4;     ret = 0;     i = 0;     ...…

查看全部问答>

求助:窗口看门狗

if (RCC_GetFlagStatus(RCC_FLAG_WWDGRST) != RESET){     RCC_ClearFlag();}WWDG_DeInit();RCC_APB1PeriphClockCmd(RCC_APB1Periph_WWDG, ENABLE);WWDG_SetPrescaler(WWDG_Prescaler_8);  ...…

查看全部问答>

只需一个电路即可满足系统解析度和 12 位精度要求

本帖最后由 dontium 于 2015-1-23 13:22 编辑 作者:Bonnie C. Baker,德州仪器 (TI) 高级应用工程师   关键字:模拟电路设计、电容、电阻、转换器、ADC、工业应用、医疗电子、运算放大器、系统设计、工程教育、物理验证和分析、信号完整性 ...…

查看全部问答>

富士通开发板DIY:晒一下厨房DIY的成果和进度

厨房部分的功能全部调试完毕,只差无线调试和串口调试了!烟雾部分:模拟开关:温湿度部分:步进电机部分:整体:各部分心得会逐步分享,请大家指正!…

查看全部问答>

关于v4l2的驱动编写和应用程序编写资料

V4L2——驱动编写指南(中文版) Video for Linux Two API Specification Draft 0.12 Video for Linux Two API Specification Revision 0.24…

查看全部问答>