机器人
返回首页

夯实物理AI底座,英伟达CoRL大会连发重磅模型与仿真库

2025-09-29 来源:EEWorld

黄仁勋曾经预测,物理AI将催生超50万亿美元规模的行业变革,涉及1000万家工厂、20万个仓库、未来数十亿计台人形机器人和15亿辆汽车及卡车。这些物理世界的“传感器”与“执行器”,正等待一套能让它们“思考并行动”的技术体系,英伟达正为此而努力。


在一年一度的CoRL(机器人学习大会)上,英伟达发布了全新开源模型与仿真库,通过一整套解决方案,进一步助推机器人技术向前发展。


Newton引擎:真正实现开源且由社区驱动


机器人在仿真环境中学习更高效、安全,但人形机器人因关节、平衡及动作复杂,现有物理引擎难以满足需求。全球超25万机器人开发者急需精准物理仿真技术,确保机器人在仿真中习得的技能能安全可靠地应用到现实世界。


今年3月圣何塞GTC大会上,英伟达宣布推出基于NVIDIA Warp与Open USD构建的开源GPU加速物理引擎Newton,该引擎由谷歌DeepMind、迪士尼研究院与英伟达联合研发,旨在推动机器人学习与开发。这一引擎的出现,有望解决人形机器人研发中 “仿真-现实鸿沟” 的核心瓶颈。


NVIDIA Omniverse副总裁Rev Lebaredian表示,目前Newton测试版已向所有机器人开发者开放,由Linux基金会管理,真正实现开源且由社区驱动。


据介绍,Newton专为机器人研发人员设计,不依赖特定仿真器,可与MuJoCo、NVIDIA Isaac Lab等机器人学习框架兼容;具备可微性,能让机器人像通过试错学习般,理解自身动作对结果的影响;同时兼具灵活性与可扩展性,支持多种求解器协同工作以完成复杂仿真任务。


image.png


当前,Newton已集成到NVIDIA Isaac Lab开发平台,苏黎世联邦理工学院、慕尼黑工业大学、北京大学等高校,以及Lightwheel、Style3D等机器人公司已率先使用,前者用它训练机器人在复杂地形行走,后者借助它优化机械臂抓取算法。


Isaac GR00T N1.6两项重要更新


让机器人完成预设动作不难,但要让它理解模糊指令、应对以前未见过的复杂情况却很难,比如“把桌上的吐司放进烤面包机并启动”。过去,机器人处理这类任务需编写大量规则,一旦场景变化(比如烤面包机位置移动)就会失效。

自OpenAI推出CLIP模型以来,视觉语言模型虽改变了目标识别、模式识别等计算机视觉任务,但仍无法解决多步骤任务,也难以应对模糊场景或全新情况。人类可凭借日常经验应对现实世界中各类复杂场景,而人形机器人需具备推理能力,才能理解模糊指令并适应完全陌生的环境。


英伟达于今年5月推出GR00T N1.5模型,此次会议中,Rev Lebaredian兴奋地宣布GR00T N1.6模型即将上线。这些模型均为开放、可定制的跨载体机器人基础模型,且经过优化,可在英伟达加速计算平台上运行。


Rev Lebaredian介绍,GR00T N1.6 包含两项重要更新:一是采用Cosmos Reason作为 “长效推理核心”,Cosmos Reason在Hugging Face平台物理推理排行榜中位列榜首,下载量超100万次,作为物理人工智能领域开放可定制的推理型视觉语言模型(VLM),它能为人形机器人赋予推理能力,使其借助已有知识与常识拆解复杂指令并执行任务;二是支持人形机器人同时完成移动与物体操控动作,躯干与手臂活动自由度更高,可完成开启沉重大门等高难度任务。


目前AeiROBOT、Franka Robotics、LG Electronics、光轮智能、Mentee Robotics、Neura Robotics、Solomon、Techman Robot 和 UCR 等领先机器人制造商,正评估采用 NVIDIA Isaac GR00T N 系列模型来打造通用机器人。


Cosmos Predict与Cosmos Transfer世界基础模型新版本即将发布


与可利用互联网海量人类知识训练的大型语言模型(LLM)不同,物理人工智能模型缺乏此类训练数据。现实世界数据采集成本高且存在安全风险,仅通过预训练也无法满足需求。要训练GR00T等模型,需以可扩展、低成本的方式生成规模庞大、类型多样且物理属性精准的数据。


对此,英伟达宣布Cosmos Predict与Cosmos Transfer世界基础模型新版本即将发布。


Rev Lebaredian进一步解释道,Cosmos Predict可根据初始状态生成未来状态,新版本将三个独立模型整合为一个,大幅降低训练后的时间复杂度与计算成本,不仅质量优于旧版本及同类规模开源模型,还支持多传感器机器人与自动驾驶汽车的多视角输出,可生成时长最长30秒的视频;Cosmos Transfer主要用于实现不同场景间的风格迁移,最新版本体积较之前缩小3.5倍,更低的资源占用不仅降低计算成本,还便于开发者扩充和扩展训练数据。这两款模型共同助力生成数百个传感器丰富的虚拟环境,为机器人训练提供支持,减少对现实世界数据采集的依赖。随着机器人推理时代来临,机器人需要一台能为从“大脑”到“身体”的整个系统提供动力的超级计算机。


全栈基础设施:支撑物理AI“全生命周期”


上个月,英伟达宣布功能强大的机器人计算机Jetson Thor正式上市,该计算机专为物理人工智能与机器人技术设计,搭载英伟达 Blackwell GPU,内存达128GB,具备强大人工智能性能,可运行Isaac、GR00T、Cosmos 世界基础模型等最新模型。


image.png


如果说Newton是“肌肉”、Isaac GR00T是“大脑”,那英伟达的基础设施就是支撑机器人“从生到长”的“骨架”。此次CoRL大会上,英伟达明确了物理AI的三大计算支柱,覆盖研发全流程:


在训练端,英伟达GB200 NVL72机架式系统成了“算力底座”——集成36个Grace CPU和72个Blackwell GPU,能同时处理大规模物理仿真数据与AI模型训练,目前主流云厂商已开始部署该系统,为机器人公司提供弹性算力;在仿真端,Omniverse平台新增Cosmos Predict 2.5与Transfer 2.5模型,前者能生成30秒长的机器人动作视频、模拟多视角环境,后者可将3D仿真场景转化为照片级合成数据,帮模型快速适应不同光线、地形;在部署端,Jetson AGX Thor开发板成了人形机器人的“随身算力站”——基于Blackwell GPU,它的AI算力是前代Orin的7.5倍,能效提升3.5倍,能实时运行Isaac GROOT模型与多传感器融合算法,Figure AI、Unitree等人形机器人公司已确定将其用于下一代产品。


这套基础设施的协同效应正在显现:波士顿动力用Omniverse的灵巧抓取工作流训练Atlas机器人,让其抓取精度提升40%;RAI研究所借助RTX PRO服务器,同时运行100个机器人仿真场景测试算法;Google DeepMind则用Jetson Thor,在实体机器人上实时运行强化学习模型。


写在最后


Rev Lebaredian总结道,英伟达正通过全新开放模型与仿真库加速机器人研究与开发,并提供三类计算机,帮助合作伙伴缩短机器人解决方案的开发与部署周期;由英伟达、谷歌DeepMind、迪士尼研究院联合研发的开源物理引擎Newton已集成至 Isaac Lab,由 Linux 基金会管理,为机器人研发人员带来顶尖仿真与物理技术;全新开放模型为人形机器人赋予推理能力,使其能借助已有知识与常识拆解复杂指令并执行任务;最后,由Blackwell驱动的Jetson Thor支持实时推理,且具备运行最新开放模型的人工智能性能。


值得注意的是,Newton与GR00T都采用开源的模式,对此Rev Lebaredian认为共享知识技术是科学进步关键,物理人工智能领域技术难度高,开源能降低全球研究者与初创企业研发门槛,汇聚力量推动行业发展,英伟达还会通过论文、会议等分享成果。


对于物理AI的发展轨迹与未来,Rev Lebaredian认为,虽然物理AI发展加速但仍处起步阶段,行业已从“感知AI”“生成式AI”“智能体AI” 迈向“物理 AI(机器人时代)”,且基于过往AI积累起点更高。目前自动驾驶已现产品化趋势,英伟达持续看好物理AI的前景,并在不断加大投入并投资相关企业。


而对于英伟达在物理AI生态中的定位,Rev Lebaredian表示物理AI与机器人研发难度大、涉及领域广,没有任何一家企业能独立完成所有工作,需要整个行业协同推进。英伟达在生态中的核心定位是“计算机提供者”,研发三类支撑物理人工智能的关键计算机:一是安装在机器人本体上的 Jetson AGX 系统;二是用于训练机器人 “大脑” 的 DGX、HGX 人工智能训练系统(“人工智能工厂”);三是用于仿真的 Omniverse 系统(搭载 RTX Pro Blackwell),这三类计算机分别对应机器人 “执行”“大脑训练”“仿真测试” 三大核心需求。


但仅靠硬件支撑远远不够,生态还需要其他参与者:如研发机器人 “身体” 的企业、开发操作系统与舰队管理系统的团队、针对特定场景优化机器人技能与 “大脑” 模型的机构等。目前,几乎所有物理人工智能与机器人领域企业都在使用英伟达的至少一类计算机(多数使用两类,部分使用三类),英伟达愿与全行业合作,共同推动物理人工智能普及。

进入机器人查看更多内容>>
相关视频
  • 直播回放: 如何使用MPLAB® Mindi™软件进行模拟电路仿真

  • 直播回放: 开启 SDV 的未来:集成 TI 的远程控制边缘节点解决方案

  • 直播回放: 2026 是德科技XR8新品发布: 一段跨越70年的示波器创新之旅

  • 直播回放: 使用RUHMI模型转换器部署BYOM模型并进行MINST模型部署

  • 直播回放: 使用Reality AI Tools 基于数据创建微小型AI模型以及进行拉弧检测开发实践

  • 直播回放: MPS 赋能人形机器人 - 因为没有运动,机器人只是一尊雕塑

精选电路图
  • 锂离子/锂聚合物USB电池充电器

  • 6晶体管H桥

  • AVR LCD温度计—LM35

  • AVR PC步进电机驱动器

  • AVR温度计TCN75

  • JDM2 PIC 18F 编程器

    相关电子头条文章