历史上的今天
返回首页

历史上的今天

今天是:2025年03月19日(星期三)

正在发生

2019年03月19日 | Nvidia用CUDA生态来应对AI芯片厂的挑战

2019-03-19 来源: 半导体行业观察

一年一度的GTC(Graphic Technology Conference,每年由Nvidia主办的GPU技术会议)在硅谷圣克拉拉正式拉开了帷幕。Nvidia CEO 黄仁勋的主题演讲往往是每年GTC的热点,本文将为大家带来今年GTC黄仁勋主题演讲的内容分析。


PRADA:GTC2019 关键词


近几年,人工智能持续得到关注,Nvidia的GPU则成为了人工智能计算的基础设施。同时,Nvidia也借着这股东风在近几年内硅谷最炙手可热的公司之一。


事实上,Nvidia的GPU成为人工智能的基石,不仅仅是因为其GPU支持大规模并行(这一点AMD的GPU也能做到),更因为其生态系统。Nvidia早年研发的在GPU上做通用计算的CUDA生态在经过数年艰苦经营后成为了人工智能开发者的首选,从而为Nvidia的GPU在人工智能领域的领先地位建成了坚实的护城河。


然而,随着人工智能的走火,Nvidia在芯片领域也受到了不少初创公司的挑战。毕竟,GPU原本并非为人工智能专门设计,因此其效率相比专门为人工智能优化的专用芯片来说相差不少。因此,Nvidia在这一领域最大的优势并非芯片,而是其CUDA生态。这也是今年GTC黄仁勋主题演讲的焦点。


黄仁勋在今年的主题演讲中作为纲领的关键词是PRogrammable Acceleration (for multiple) Domains (with one) Architecture,即PRADA。PRADA的意思是“使用一个统一的硬件和底层软件接口架构(CUDA-X),通过编程可以为不同的领域做定制化的高效率加速”。在这里,PRADA有明显的回应AI芯片初创公司的意味,首先AI芯片往往宣称GPU无法做domain-specific acceleration,因此效率差;而Nvidia则用PRADA回应说GPU通过编程也可以做高效domain-specific acceleration。更进一步,由于AI芯片往往只针对特定应用,因此不同的应用需要不同的芯片,不同的软件API以及系统框架,因此会造成碎片化的问题;而使用GPU配合其强大的CUDA生态则可以完美解决这个问题,使用同一类硬件,同一种框架就可以解决不同领域的问题。



今年的GTC的开场中,Nvidia列举了众多基于GPU的AI能担任的角色,包括Visionary(智能设计),Guardian(计算机视觉),Navigator(无人车和无人机),Scientist(数据挖掘),Healer(深度学习医疗),以及Artist(基于AI的内容生成)。这些内容都包含在了PRADA的领域中,也让我们看到了Nvidia在AI时代的野心。


计算机图像:Nvidia的基本盘


在今年的GTC上,Nvidia在计算机图像领域的主题是实时ray tracing(RTX)。这个主题从去年开始就开始宣传,在今天Nvidia在GTC上则主要是给出了一些RTX的落地应用。有趣的是,重点不再是游戏,而是智能设计中的渲染和多媒体设计中的渲染。


首先展示的demo是汽车智能设计中的实时RTX。在demo中,使用RTX渲染的图像和真实的汽车图像让人难辨真假,而更重要的是RTX可以做到实时。因此,设计者可以实时更改设计,更改表面材料属性,从而实时看到更改造成的表面光反射等。在这里,Nvidia同时宣布了对于最新版Unity的支持,强强结合为智能设计赋能。



此后,Nvidia展示了RTX在游戏中的应用。比较令老玩家感动的是Nvidia对于Quake II做了RTX的重制,从而让经典游戏焕发出了新的光彩。



最后,Nvidia展示了其GPU在多媒体内容(电影等)渲染中的应用,包括其强大的生态伙伴,包括微软的DirectX,Unity等。


AI与超级计算机


在传统的图像渲染之外,Nvidia的第二个主题是行业用大数据分析。


在这里,黄仁勋首先重申了Nvidia在大数据时代的愿景。在大数据时代,最关键的基础设施是计算能力。本环节的看点是,Nvidia的关注点已经从“神经网络”这一种狭义的机器学习方法拓展到了更广阔的大数据处理能力,包括对XGBoost等传统机器学习算法的支持。这一方面说明了Nvidia对于大数据时代的看好,另一方面也体现了GPU的通用性。


Nvidia首先展示了一个微软Bing基于其GPU的智能助手demo,该助手类似Siri,可以识别用户的语音命令,并且使用自然语言处理方法理解用户的意图,通过搜索引擎搜索到相关结果呈现在用户面前,同时把最关键的一条结果用语音播报给用户。在这里,处理延迟是关键指标(GPU计算高延迟也往往是为人诟病的痛点),而Bing的演示中该助手使用非常流畅,可见是做了很多优化,体现了GPU在低延迟应用中的潜力。


之后,Nvidia把重心放到了超级计算机上。为了帮助大数据应用,Nvidia提出了“数据科学服务器”的概念。传统的服务器大致可以分成两类,一类是超级计算机supercomputer,其处理的任务计算量大,但是任务数目有限;另一类是hyperscale,其处理的任务计算量并不大,但是任务并发数量非常大,类似于网络搜索等。而大数据应用则是在两者之间,其处理的任务计算量较大(如训练任务),同时任务数量也不小。Nvidia认为其GPU架构非常适合这类数据科学计算应用,并发布了数据科学服务器。该服务器的性能将比原有的DGX-2略低,但是其对于RDMA等关键技术的支持可以使这样的服务器能快速形成计算集群,从而满足数据科学对于算力的需求。



机器人应用


这次Nvidia的演讲的第三部分是关于机器人。机器人部分其实是从原来的自动驾驶概念拓展而来(自动驾驶也属于机器人的一部分)。机器人与自动驾驶事实上都是一脉相承,其要点在于能在本地提供低延迟、高可靠性的强算力系统,而目前机器人在各大智能工业领域纷纷落地得到使用,因此Nvidia将其概念拓展到机器人可谓是顺势而为。


首先发布的是Jetson Nano开发板,是基于之前的Tegra X1芯片,在板子设计上做了精简,以$99的低价发售。



之后的重点仍然是自动驾驶。在自动驾驶方面,第一个上场的是最新版本的Drive Ap2X,它是Nvidia的level-2自动驾驶系统。该系统可以实现自动收集本地高精度地图,并实现交通标志检测等。



在这之后,黄仁勋隆重介绍了Drive AV,这是Nvidia的路线规划系统。该系统可以对于其他车辆的行动路径做预测,从而实现安全驾驶。此外,还有Constellation系统,该系统是包括了软件和计算硬件的自动驾驶模拟系统。该系统可以让用户可以以驾驶员的角度来实时观测驾驶的效果,从而尽可能保证安全驾驶。最后,Nvidia还发布了和丰田的全方位合作,将从硬件到软件上一起构建下一代自动驾驶系统。



结语


在本次GTC的主题演讲中,我们看到了一个重要的方向,即人工智能已经在进入了落地阶段。对于人工智能,Nvidia不再有太多花哨的概念和宏大的前景预期,而是踏踏实实将几个可以落地的应用落到实处。在落地的过程中,也不再拘泥于“深度学习”,“自动驾驶”等热门风口,而是合并同类项,将“深度学习”拓展到了“大数据”,同时将“自动驾驶”拓展到了“机器人”。我们认为对于人工智能行业来说,确实也进入了落地的阶段。在未来的数年内,我们将看到这些概念的一一实际应用,为我们的生活带来更多实际变化。


此外,面对AI芯片初创公司的挑战,Nvidia则是重申了“生态”这一利器并多次提及了其CUDA-X生态,而生态也确实是目前Nvidia最高的护城河。预计AI芯片初创公司只能先从一些较小但是有明确痛点的地方入手,才能慢慢站住脚跟并挑战Nvidia的位置。



推荐阅读

史海拾趣

格瑞宝(GP)公司的发展小趣事

格瑞宝公司致力于功率器件的研发与销售,其产品线不断丰富和完善。从最初的MOSFET产品系列,到后来逐渐扩展到DIODE、BJT、IC集成电路等多个领域,格瑞宝始终坚持技术创新,不断推出符合市场需求的新产品。特别是在SGT MOST工艺方面,格瑞宝达到了国内领先水平,这一技术突破不仅提升了产品的性能和质量,也进一步巩固了公司在行业内的地位。

Bel Fuse公司的发展小趣事

进入XXXX年代,电子行业经历了深刻的变革,新兴技术的涌现给传统企业带来了挑战。Bel Fuse也面临着市场需求的变化和竞争压力的增加。为了应对这些变革,公司进行了战略调整,将重点放在了连接器、电源、磁性元件和电路保护产品等领域。通过加大研发力度和市场推广,Bel Fuse成功实现了产品升级和市场拓展。

DURATOOL公司的发展小趣事

DURATOOL公司自成立以来,一直致力于电子工具的技术创新。在20世纪90年代,公司研发出了一款具有革命性的数字万用表,该产品在精确度、稳定性和操作便捷性方面均大幅超越当时的市场主流产品。这一创新不仅为DURATOOL公司赢得了大量忠实用户,也为其在电子测量工具市场树立了技术领先的形象。随后,DURATOOL公司不断加大研发投入,推出了一系列具有竞争力的新产品,逐步巩固了其在电子工具行业的领先地位。

铨力(ALLPOWER)公司的发展小趣事

铨力(ALLPOWER)公司成立于XXXX年,由一群热衷于绿色能源技术的创新者共同创立。公司初期专注于太阳能电源产品的研发和生产,凭借着对技术的深入研究和市场需求的敏锐洞察,很快在行业中崭露头角。通过不断的技术创新和产品优化,铨力逐渐在太阳能电源领域建立起自己的品牌地位。

Green Power Solutions公司的发展小趣事
电解电容漏液、击穿或老化也会影响稳压器的性能。
Comtronic Gmbh-Verbindungstechnik公司的发展小趣事
可能是由于控制电路故障、磁放大器调整不当或电源电压波动过大等原因。

问答坊 | AI 解惑

最强大的串口桥式转换芯片

本帖最后由 jameswangsynnex 于 2015-3-3 19:57 编辑 我公司是JM系列IC的一级代理商,下面是JM IC的功能型号简介: JMicron智微科技主要产品研发方向为高速串行式连结(High Speed Serial Link)的相关技术,该技术现已广泛应用于Serial ATA、PCI E ...…

查看全部问答>

3.3 伏至 5 伏互联技巧

本帖最后由 paulhyde 于 2014-9-15 08:58 编辑 概述 我们对处理速度的需求日益增长,伴随着这种增长,用来构建单片机的晶体管尺寸则在持续减小。以更低的成本实现更高的集成度,也促进了对更小的几何尺寸的需求。随着尺寸的减小,晶体管击穿电压 ...…

查看全部问答>

C++.net硬件开发

请问各位大侠,C++.net能开发硬件程序吗,就是那种控制门口挡车杆升降的程序。 如果不能,那可以用VisualC++开发吗? 多种语言开发的程序可不可以组成一个软件上那? 谢谢各位。…

查看全部问答>

谁知道PROTEUS的第三方元件库怎么添加

有谁知道PROTEUS的第三方元件库怎么添加啊,我用的是7.5sp3的版本,我把.lib文件加到元件库里面但是还是以前那些元件,这是怎么回事啊?请大家帮帮忙!!!谢谢…

查看全部问答>

寻找西安写PDA软件的开发人员或公司。

要求:1、熟悉WINCE平台       2、有相关产品介绍       3、必须是西安的 联系QQ:112654 信箱:xclion@126.com 价格面谈。…

查看全部问答>

【重量级】使用RT-Thread RTOS及附属组件的LM3S8962评估板的例程

Introduction •这是使用RT-Thread RTOS及附属组件的LM3S8962评估板例程,对LM3S系列其他芯片也同样适用。所有例程源码来自开源实时操作系统RT-Thread的官方SVN源码服务器。这儿将例程做成了一个个单独的工程,目的是为了使刚接触RT-Thread的 ...…

查看全部问答>

07.28【每周讨论】相信大家都知道C语言了,那么E(易)语言呢?

第一次听说E语言听过,不了解最近刚刚知道一点点知道,感觉不错 [ 本帖最后由 longxtianya 于 2011-7-30 19:48 编辑 ]…

查看全部问答>

SimpliciTI-IAR-1.2.0>>CC430EM里的程序为何不能用了????

我用SimpliciTI-IAR-1.2.0里的cc430例程,用cc430F5137模块来测试程序AP_as_Data_Hub,为何AP和ED连接不上了,我的ED发送地址是0xFF,为何发不出去了???望各位老师能够解答我的难题 !在此谢过!…

查看全部问答>

LM3S9B96开发板里面怎么没有spiflash_rw例程?

    lm3s9b96开发板里面怎么没有spiflash_rw例程?   …

查看全部问答>