历史上的今天
返回首页

历史上的今天

今天是:2024年10月23日(星期三)

正在发生

2020年10月23日 | 绝对碾压,NVIDIA A100 GPU推理性能超CPU237倍

2020-10-23 来源:雷锋网

MLPerf组织发布最新的推理基准测试(Benchmark)MLPerf Inference v0.7结果,总共有23个组织提交了结果,相比上一个版本(MLPerf Inference v0.5)的12个提交者增加了近一倍。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

结果显示,今年5月NVIDIA(Nvidia)发布的安培(Ampere)架构A100 Tensor Core GPU,在云端推理的基准测试性能是最先进Intel CPU的237倍。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

MLPerf Inference V0.7部分结果截图 

 

最新的AI推理测试结果意味着,NVIDIA未来可能在AI推理和训练市场都占据领导地位,给云端AI推理市场拥有优势的Intel带来更大压力的同时,也将让其他追赶者面临更大挑战。

 

MLPerf推理基准测试进一步完善的价值

 

与2019年的MLPerf Inference v0.5版本相比,最新的0.7版本将测试从AI研究的核心视觉和语言的5项测试,扩展了到了包括推荐系统、自然语言理解、语音识别和医疗影像应用的6项测试,并且有分别针对云端和终端推理的测试,还加入了手机和笔记本电脑的结果。

 

扩展的测试项从MLPerf和业界两个角度都有积极意义。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

MLPerf Inference v0.5测试项

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

MLPerf Inference v0.7数据中心测试项

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

MLPerf Inference v0.7边缘端测试项

 

任何一个基准测试都需要给业界具有参考价值的指标。MLPerf基准测试是在业界缺乏对AI芯片公认的评价标准的2018年诞生,因此,MLPerf组织既需要给出各方都认可的成绩,还需要根据AI行业的发展完善评价标准。

 

不过,AI行业发展迅速,AI模型的参数越来越多,应用的场景也越来越广泛。评价AI芯片和系统的推理性能需要涵盖可编程性、延迟、准确性、模型大小、吞吐量、能效等指标,也需要选择更具指导价值的模型和应用。

 

此次增加的推荐系统测试对于互联网公司意义重大。在王喆的《深度学习推荐系统》一书中提到,2019年天猫“双11”的成交额是2684亿元,假设推荐系统进行了优化,整体的转化率提高1%,那么增加的成交额大约为26.84亿元。

 

另外,MLPerf Inference v0.7中增加医疗影像3D U-Net模型测试与新冠大流行以及AI在医疗行业的重要性与日俱增密切相关,比如一家初创公司使用AI简化了超声心电图的采集工作,在新冠大流行初期发挥了作用。

 

基准测试从v0.5到v0.7,能够为要选用AI芯片和系统的公司提供更直观和有价值的参考是MLPerf基准测试的价值所在,比如,帮助金融结构的会话式AI更快速回答客户问题,帮助零售商使用AI保证货架库存充足。

 

与此同时,这也将促进MLPerf组织在业界的受认可程度,从接近翻倍的提交成绩的组织就能看出来。

 

GPU云端推理性能最高是CPU的237倍

 

过去几年,云端AI训练市场NVIDIA拥有绝对优势,云端AI推理市场被Intel赚取了大部分利润是事实。这让不少人都产生了GPU更适合训练而CPU更适合推理的认知,但MLPerf最新的推理测试结果可能会改变这一观点。

 

MLPerf Inference V0.7的测试结果显示,在数据中心OFFLINE(离线)测试模式下,赛灵思U250和IntelCooper Lake在各个测试模型下与NVIDIAT4的差距不大,但A100对比CPU、FPGA和自家的T4就有明显的性能差距。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

在SERVER模式下的推荐系统DLRM模型下,A100 GPU对比IntelCooper Lake有最高237倍的性能差距,在其他模型下也有比较显著的差距。值得注意的是,Intel的Cooper Lake系统的状态还是预览,其余三款芯片的系统都已经可用。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

A100 GPU的优势也在边缘推理中也十分明显。在单数据流(Singel-Stream)测试中,A100对比NVIDIAT4和面向边缘终端的NVIDIAJetson AGX Xavier有几倍到十几倍的性能优势。在多数据流(Multi-Stream)测试中,A100对比另外两款自家产品在不同AI模型中有几倍到二十多倍的性能优势。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

在边缘OFFLINE模式下,A100对比T4和Jetson AGX Xavier也有几倍到二十多倍的性能优势。

 

这很好地说明A100的安培架构以及其第三代Tensor Core优势的同时,也表明了NVIDIA能够覆盖整个AI推理市场。

 

在此次提交结果的23家公司中,除了NVIDIA外还有11家其合作伙伴提交了基于NVIDIA GPU的1029个测试结果,占数据中心和边缘类别中参评测试结果总数的85%以上。

 

从提交结果的合作伙伴的系统中可以看到,NVIDIAT4仍然是企业的边缘服务器推理平台的主要选择。A100提升到新高度的性能意味着未来企业边缘服务器在选择AI推理平台的时候,可以从T4升级到A100,对于功耗受限的设备,可以选择Jeston系列产品。

 

特别值得注意的是,NVIDIA GPU首次在公有云中实现了超越CPU的AI推理能力。

 

临界点到来?AI推理芯片市场竞争门槛更高

 

五年前,只有少数领先的高科技公司使用GPU进行推理。如今,NVIDIAGPU首次在公有云市场实现超越CPU的AI推理能力,或许意味着AI推理市场临界点的到来。NVIDIA还预测,基于其GPU的总体云端AI推理计算能力每两年增长约10倍,增长速度高于CPU。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

另外,NVIDIA还强调基于A100高性能系统的成本效益。NVIDIA表示,一套DGX A100系统可以提供相当于近1000台双插槽CPU服务器的性能,能为客户AI推荐系统模型从研发走向生产的过程,具有极高的成本效益。

 

时代变了!NVIDIA A100 GPU推理性能237倍碾压CPU

 

同时,NVIDIA也在不断优化推理软件堆栈,进一步提升在推理市场的竞争力。

 

最先感受到影响的会是Intel,但在云端AI推理市场体现出显著变化至少需要几年时间,因为企业在更换平台的时候会更加谨慎,生态的护城河此时也更能体现出价值。

 

但无论如何,我们都看到NVIDIA在AI市场的强势地位。雷锋网七月底报道,在MLPerf发布的MLPerf Training v0.7基准测试中,A100 Tensor Core GPU,和HDR InfiniBand实现多个DGX A100 系统互联的庞大集群DGX SuperPOD系统在性能上开创了八个全新里程碑,共打破16项纪录。

 

安培架构A100在MLPerf最新的训练和推理成绩表明NVIDIA不仅给云端AI训练的竞争者更大的压力,也可能改变AI推理市场的格局。

 

NVIDIA将其在云端训练市场的优势进一步拓展到云端和边缘推理市场符合AI未来的发展趋势。有预测指出,随着AI模型的成熟,市场对云端AI训练需求的增速将会降低,云端AI推理的市场规模将会迅速增加,并有望在2022年超过训练市场。

 

另据市场咨询公司ABI Research的数据,预计到2025年,边缘AI芯片市场收入将达到122亿美元,云端AI芯片市场收入将达到119亿美元,边缘AI芯片市场将超过云端AI芯片市场。

 

凭借强大的软硬件生态系统,NVIDIA和Intel依旧会是AI市场的重要玩家,只是随着他们竞争力的不断提升,其他参与AI市场竞争的AI芯片公司们面临的压力也随之增加。

 

推荐阅读

史海拾趣

DS-IMP公司的发展小趣事

DS-IMP公司在发展过程中,非常重视市场拓展和品牌建设。公司制定了详细的市场战略和营销计划,通过参加国内外展会、举办技术研讨会、开展产品推广活动等方式,不断提升品牌知名度和影响力。同时,公司还积极开拓国际市场,与多家国际知名企业建立了长期合作关系。这些努力使得公司的市场份额不断扩大,品牌影响力逐渐增强。

Cornerstone Sensors公司的发展小趣事

Cornerstone Sensors公司成立于电子行业的蓬勃发展时期。创立初期,公司就明确了以传感器技术为核心的发展方向。公司聚集了一批优秀的工程师和科学家,致力于研发高精度、高稳定性的传感器产品。经过数年的技术积累和产品研发,Cornerstone Sensors逐渐在传感器领域崭露头角,其产品质量和技术水平得到了行业的广泛认可。

Advanced Photonix公司的发展小趣事

在光电技术不断发展的背景下,Advanced Photonix开始研发太赫兹传感器产品。这种传感器产品主要针对无损检测和质量控制市场,如行李和货物的安全检查等。经过长时间的努力,公司成功开发出了一系列高性能的太赫兹传感器,这些产品凭借其高可靠性和精确性,迅速赢得了市场的青睐。通过与各大航空公司和物流企业的合作,Advanced Photonix的太赫兹传感器产品在全球范围内得到了广泛应用,为公司的快速发展注入了新的动力。

BVLED公司的发展小趣事

在追求经济效益的同时,BVLED公司也积极履行社会责任,致力于推动可持续发展。公司注重环保和节能技术的研发和应用,推出了一系列环保型LED产品;同时,公司还积极参与公益事业和慈善活动,为社会做出贡献。这些举措不仅提升了公司的社会形象,也为公司的长远发展奠定了坚实的基础。

请注意,以上仅为一个框架性的描述,并未涉及具体的公司名称、时间、地点等细节。你可以根据这个框架进行进一步的创作和补充,以形成完整的故事。同时,由于每个公司的发展轨迹都有其独特之处,你也可以结合你对电子行业LED公司的了解和观察,来创作出更具真实感和说服力的故事。

Arima Lasers Corp公司的发展小趣事

Arima Lasers Corp深知人才是企业发展的核心驱动力。因此,公司高度重视人才培养和团队建设。通过制定完善的培训计划和激励机制,公司吸引了一批批优秀的研发人才和管理人才。这些人才为公司的发展注入了源源不断的动力,推动了公司在技术、市场和管理等各个方面的全面提升。

Component General Inc公司的发展小趣事

随着市场的不断发展和竞争的加剧,Component General Inc公司意识到只有不断创新才能在行业中立足。因此,公司加大了对研发的投入,积极引进先进的技术和设备。经过多年的努力,公司成功地推出了一系列具有创新性的产品,如衰减器、同轴端子等,这些产品不仅提高了公司的市场竞争力,也为客户提供了更优质的解决方案。

问答坊 | AI 解惑

关于电源适配器的一点常识

1、电源适配器(以下简称电源)的标称电压和电流是什么意思?   首先电源适配器的标称电压通常指的是开路输出电压,也就是不接任何负载,没有电流输出的电压值。因此也可以认为这是该电源的输出电压上限。对于电源内部使用了主动稳压单元或者电 ...…

查看全部问答>

linux学习讨论帖!

大家在这里讨论关于linux的相关问题!有什么问题大家帮您解决一下! 看到好的东西可以发到上面的linux资料中,谢谢! [ 本帖最后由 daicheng 于 2009-7-3 15:48 编辑 ]…

查看全部问答>

无线摄像头简析

关键字:无线摄像头        众所周知,一个监控系统里需要布设大量的各种各样的线材。一方面耗去了大量的人力,另一方面也消耗了大量的铜和塑料。真是劳命伤财,浪费资源,也于环保的理念相违背。人们期待着更简便的音视频传 ...…

查看全部问答>

两个破解文件

Xilinx_ISE11.1_avnet_bj_crack_hostid_any Quartus II 9.0 Linux Crack …

查看全部问答>

分享电子设计学习资料

想自己当初电子设计,走过这种弯路,有过不少挫折和打击。这些资料都来自互联网,有的来源已经不清楚,还望原作者莫怪。整理了下,share下,希望对初学者有点帮助。…

查看全部问答>

请问各位,有没有可以通过短信设置APN等上网参数的协议

请问各位,有没有可以通过短信设置APN等上网参数的协议 如果有,麻烦给个下载链接,谢谢!…

查看全部问答>

请问:开发板DM9000A与主机通信问题

我把主机ip设置为211.83.102.215,板子上dm9000a的ip设置为211.83.102.214 通过交换机相连 板子上电,进入u-boot中,使用tftp下载内核和文件系统,下载的非常快,反正是基本没有什么延时 但是当我进入系统之后,再使用板子ping主机就出现了问题 ...…

查看全部问答>

【我给xilinx资源中心做贡献】Spartan-3配置接口

Spartan-3配置接口1)  接口电压 a..配置口和JTAG接口采用LVCOMS25标准,最小驱动为12毫安,快速翻转率。 b..这些用于配置的I/O口和用户I/O一样可以承受3.3V输入 c..用户I/O/配置双用管脚(如Din)采用Vcco供电,专用管脚采用Vccaux供 ...…

查看全部问答>

msp430.5438的统一时钟

         随着芯片的日益更新,更多功能强大的芯片出现了,代替了原来的一带二代芯片,在这里,msp430.5438作为msp430低功耗代表的芯片应运而生。         随之而来 ...…

查看全部问答>

关于ROM里面的safertos

看到9b96里面固化了个safertos,我的问题是这个固化的rtos,怎么用呢?它底层的移植部分难道TI也全做好了,用户直接就调rtos提供的api编程?…

查看全部问答>