历史上的今天
今天是:2024年11月15日(星期五)
2021年11月15日 | NVIDIA发布包含数十种新的、更新的加速计算库
2021-11-15 来源:EEWORLD
用于加速PyData生态系统量子计算、到户交付和超级计算的65个软件开发工具包,为150多种产品带来了性能提升。

NVIDIA发布了65个全新及更新的软件开发工具包,包括库、代码样本和指南,为正在推动广泛计算挑战前沿的数据科学家、研究者、学生和开发者带来更好的特性和功能,这些新推出及更新的加速计算库再次体现了NVIDIA在软件方面的投入,及其对AI行业的承诺。
NVIDIA创始人兼首席执行官黄仁勋在其GTC主题演讲中发布了这些新增内容,其中包括用于加速量子计算、到户交付算法和图形神经网络挖掘的新一代SDK。
NVIDIA产品目录中有150多个加速计算工具包,NVIDIA开发者计划中的近300万名成员使用这些工具包,这个数字在过去五年增长了6倍。CUDA(并行计算平台和编程模型)仅在去年就被下载了700万次,自发布以来的下载次数已达到3000万次。
拓展新市场
新发布的SDK有:
NVIDIA ReOpt:用于实时物流,引入了先进的大规模并行算法,可以优化车辆路线、仓库选择和车队组合。其动态改道功能可以减少旅行时间、节省燃料成本并最大限度地减少闲置时间,这将为物流和供应链行业节省数十亿美元。
cuNumeric:用于阵列计算,实现NumPy应用编程接口,可以自动扩展到多GPU和多节点系统,而不需要修改代码。这将给使用Python的2000万名数据科学家、研究者和科学家带来重要的价值。该工具包现已在GitHub和Conda上提供,可以扩展到数千个GPU,为PyData和NumPy生态系统创造加速计算。
cuQuantum:用于量子计算,大大加快了模拟大型量子电路的速度,使量子研究者能够研究更广泛的算法和应用空间。开发者可以模拟分子的近期变异量子算法和能够识别容错的纠错算法等领域,也可以加速Atos、谷歌和IBM的流行量子模拟器
CUDA-X加速 DGL容器:用于图形神经网络,为从事具有大型图形的GNN的开发者和数据科学家提供了一种快速建立工作环境的方法。该容器使得在结合DGL和Pytorch的集成GPU加速GNN 环境中的工作变得很容易。凭借GPU加速GNN,我们可以挖掘图形中的洞察,即使是有接近一万亿条边的全球最大图形也不例外。例如Pinterest使用具有数十亿个节点和边缘的图形神经网络来了解其具有超过3000亿个Pin的生态系统。该网络基于GPU和各种经过优化的库,可用于模型的训练和推理。
Amazon Web Services机器学习总监Alex Smola表示:“我们团队十分高兴能与NVIDIA合作,通过用于图形构建的RAPIDS cuDF、用于图形采样的RAPIDS cuGraph和GNN的自定义计算内核来加速DGL。而开源的DGL也能通过亚马逊NeptuneML以托管式服务的形式提供。”
经过更新的SDK加速应用开发
众多最受欢迎的NVIDIA SDK都增强了功能并进行了升级,包括Clara、DLSS、RTX、Nsight和Isaac工具包。
其他经过更新的SDK包括:
RAPIDS 21.10:用于数据科学,提供时间序列数据处理这项新功能并对现有算法进行多项加速。适用于 Apache Spark 3.0 的 RAPIDS 加速器允许企业在不更改代码的情况下加速其在 NVIDIA GPU 上的分析操作。今年以来,NVIDIA最受欢迎的SDK之一——RAPIDS的下载量增长了400%。
Deepstream 6.0:用于智能视频分析的Deepstream 6.0引入了新的图形合成器界面,使具有最低编码能力的用户也能使用计算机视觉,还引入了可视化拖放界面,可实现简单、直观的AI产品开发流程。
Triton 2.15、TensorRT 8.2和cuDNN 8.4:用于深度神经网络,为大型语言模型提供新的优化,并且为梯度增强决策树和随机森林提供推理加速。
DOCA 1.2:用于数据中心网络,提供一个零信任的安全框架,该框架通过硬件和软件认证、线路速率数据加密、分布式防火墙和智能遥测来扩展威胁保护。
Merlin 0.8:用于推荐系统,具有预测用户下一步行动的新功能,只需很少的用户数据,甚至无需用户数据,并且支持大于GPU内存的模型。
适用于SDK的新培训课程
根据IDC预计,全球全职开发者的短缺数量预计将从2021年的140万增加到2025年的400万。该分析公司认为,创建提供教育和赋能的基础设施是弥补这一短缺的长期解决方案。
NVIDIA深度学习培训中心的两门新课程支持并加速开发者对SDK的学习和使用,为该学院的40多门课程目录增添新的内容。
“用于DPU的DOCA介绍”是一门自学课程。该课程向开发者、研究者和学生介绍
NVIDIA DOCA的基本概念。NVIDIA DOCA是一个用于在NVIDIA BlueField DPUs上实现加速数据中心计算的平台。
将于本月晚些时候推出的“构建实时视频AI应用”课程将介绍如何使用NVIDIA
DeepStream智能视频分析工具和NVIDIA TAO工具套件将原始视频数据转化为基于实时深度学习的洞察,从而实现用于构建高性能流媒体管道的硬件加速组件。
配合新SDK的NVIDIA 深度学习培训中心课程包括:
由教师授课的“加速数据科学基础”和自学课程“加速端到端数据科学工作流”使用NVIDIA RAPIDS加速数据科学库来应用各种GPU加速机器学习算法,包括XGBoost、cuGRAPH的单源最短路径以及cuML的 KNN、DBSCAN和逻辑回归,以便执行大规模的数据分析。
“构建智能推荐系统”涵盖NVIDIA Merlin和其他用于构建高效推荐系统的基本工具和技术以及如何部署用于实时推荐的GPU加速解决方案。
关于NVIDIA
NVIDIA在1999年发明的GPU激发了PC游戏市场的增长,重新定义了现代计算机显卡、高性能计算和人工智能。公司在加速计算和人工智能领域的创新研究成果正在改变交通运输、医疗、制造等万亿美元级行业,并推动许多其他行业的发展。
史海拾趣
|
就是附件的这种D24V电动推杆 我想请教的问题是1.工作循环:最大15%或者2min持续使用,休息15分钟,怕烧坏元件吗?这是为什么? 2.快速释放功能,指的是什么? 3.可配高感应的传感器,配传感器有什么用途? 我想深入的学习下电动推杆,哪位老师 ...… 查看全部问答> |
|
如何用方向键来控制鼠标移动,我做了一个,按方向键后鼠标位置是移动了,但是鼠标一动又回到原来位置,为什么啊? 如何用方向键来控制鼠标移动,我做了一个,按方向键后鼠标位置是移动了,但是鼠标一动又回到原来位置,为什么啊?… 查看全部问答> |
|
把WINCE设备做成U盘,连到PC怎么不见U盘盘符出现?设备管理器的设备列表也显示一个黄色的感叹号,为什么?难道还需要特别的U盘驱动程序? 把WINCE设备做成U盘,连到PC怎么不见U盘盘符出现?设备管理器的设备列表也显示一个黄色的感叹号,为什么?难道还需要特别的U盘驱动程序?… 查看全部问答> |
|
【MSP430共享】基于射频技术的工程机械仪表无线通信解决方案 针对大型工程机械各类信号与驾驶操控室仪表异地显示的通信问题, 提出基于射频模块 n R F 2 4 0 1 实现无线数据通信的设计方案,详细介绍射频芯片 n R F 2 4 0 1 的工作原理及特点, 并给出了无线通信系统硬件结构、 接口电路及相应程序框图。系统 ...… 查看全部问答> |
|
作为一个多用户、多任务的操纵系统,Linux下的文件一旦被删除,是难以恢复的。尽管删除命令只是在档节点中作删除标记,并不真正清除文件内容,但是其它用户和一些有写盘动作的进程会很快笼盖这些资料。不外,对于家庭单机使用的Linux,或者误删档 ...… 查看全部问答> |
|
某天某日某产房,你诞生了(power up , 上电运行),结果你不哭,医生把你提起来,屁股上狠狠一巴掌,你哇哇大哭(reset, 复位成功),护士给你检查,看有没有传染病(EMI测试)、然后打预防针(绝缘处理),没有问题后作记录(QC pass),你的父母来接你回去(客户验收 ...… 查看全部问答> |
|
本帖最后由 dontium 于 2015-1-23 12:43 编辑 在单片IC设计过程中,我们常常会竭尽所能地对内部组件进行精确的匹配。例如,精确匹配运算放大器的输入晶体管,旨在获得低失调电压。如果我们必须使用属于我们自己的离散晶体管运算放大器,则我们会得 ...… 查看全部问答> |
|
TI技术工程师: 您好,直入主题,我现在碰到一个问题,想请教您。 现在做的项目是:无线射频(2.4G)CC2530的射频子板,现在投的PCB样机,并找专业人员手工焊接。 原理图和PCB版图基本上是按照德州仪器 ...… 查看全部问答> |




