历史上的今天
返回首页

历史上的今天

今天是:2025年04月23日(星期三)

正在发生

2021年04月23日 | Knight Rider采用GAN模型:AI 和 NVIDIA Omniverse为 KITT 带来活力

2021-04-23 来源:EEWORLD

Knight Rider采用GAN模型:AI 和 NVIDIA Omniverse为 KITT 带来活力


NVIDIA 研究院的最新模型基于 GAN,将 2D 图像转化为3D,面向游戏开发者、艺术家、设计师和建筑师

 image.png?imageView2/2/w/550


NVIDIA 研究院正在研发一种全新深度学习引擎,该引擎可以根据标准的 2D 图像来创建 3D模型,并可以在NVIDIA Omniverse中,为诸如由Knight Rider 的 AI 驱动的 KITT 等标志性汽车带来活力。


由多伦多的 NVIDIA AI 研究实验室开发的 GANverse3D 应用将平面图像放大成逼真的 3D 模型,可以在虚拟环境中可视化和控制。这种性能可以帮助建筑师、创作者、游戏开发人员和设计师轻松地将新对象添加到他们的实体模型中,而不需要 3D 建模方面的专业知识,也不需要在渲染上花费大量预算。


例如,单张汽车照片可以转换为3D模型,该模型可以在虚拟场景中行驶,并配有逼真的前灯、尾灯和转向灯。


为了生成训练数据集,研究人员利用生成性对抗网络 ——GAN合成图像,从多个角度描绘同一物体 — 就像摄影师绕着一辆停着的汽车走动,从不同的角度拍摄。这些多视图图像被插入到逆图形的渲染框架中,逆图形是从 2D 图像推断 3D 网格模型的过程。


一旦完成了多视图图像训练,GANverse3D 只需要一个 2D 图像即可预测 3D 网格模型。该模型可以与 3D 神经渲染器一起使用,使开发人员能够自定义对象和交换背景。


当作为NVIDIA Omniverse平台的扩展导入并在NVIDIA RTX GPU上运行时,GANverse3D 可将任何 2D 图像重建为 3D,就像流行的 20 世纪 80 年代Knight Rider电视节目中备受喜爱的打击犯罪的汽车 KITT 一样。


以前的逆图形模型依赖于 3D 图形作为训练数据。


相反,在没有 3D 要素的帮助下,“我们把 GAN 模型变成了一个非常高效的数据生成器,这样我们就可以基于网络上的任何 2D 图像创建出 3D 对象。”NVIDIA 的研究科学家、该项目的主要作者Wenzheng Chen 说。


“因为我们是根据真实图像而不是合成数据进行训练的,所以 AI 模型能更好地推广到现实世界的应用中。”该项目的作者、NVIDIA 研究员 Jun Gao 表示。


GANverse3D 背后的研究将在两个即将召开的会议上发表:5 月份的ICLR和 6 月份的CVPR。


从爆胎到赛车 KITT


游戏、架构和设计领域的创作者依赖于虚拟环境,例如 NVIDIA Omniverse 模拟和协作平台,在创建最终产品之前测试新的想法并可视化原型。借助Omniverse Connectors,开发人员可以在 Omniverse 中使用他们首选的 3D 应用程序,通过实时光线跟踪来模拟复杂的虚拟世界。


但并不是每个创作者都有时间和资源为他们所绘制的每一个对象创建 3D 模型。若要渲染展厅的汽车,或一条街的建筑,需捕获所需数量的多视图图像,成本可能高得令人望而却步。


在这方面,训练好的 GANverse3D 应用可以用来将汽车、建筑甚至一匹马的标准图像转换成可以在 Omniverse 中自定义和制作动画的 3D 图形。


为了重建 KITT,研究人员只需给训练好的模型输入汽车的图像,让 GANverse3D 预测相应的 3D 纹理网格,以及车辆的不同部分,例如车轮和前照灯。然后,他们使用NVIDIA Omniverse 套件和NVIDIA PhysX工具将预测的纹理转换成高质量的材料,使 KITT 具有更真实的外观和感觉,并将其与其他汽车一起放置在动态驾驶序列中。


“Omniverse 让研究人员能够将激动人心的前沿研究直接带给创作者和最终用户。”NVIDIA深度学习工程师 Jean-Francois Lafleche说道。“作为 Omniverse 的扩展,GANverse3D 将帮助艺术家为游戏开发、城市规划甚至训练新的机器学习模型创建更丰富的虚拟世界。”


GAN 推动维度转变


因为从不同角度捕捉同一物体的真实数据集很少,所以大多数将图像从 2D 转换为 3D 的 AI 工具都是使用像ShapeNet这样的合成 3D 数据集进行训练的。


为了从现实世界的数据中获得多视图图像,例如网上公开的汽车图像,NVIDIA 研究人员转而使用GAN 模型,修改其神经网络层,将其转化为数据生成器。


该团队发现,仅训练神经网络的前4层,冻结剩余的 12 层参数,可以让 GAN 从不同的角度渲染同一对象的图像。


保持前4层参数冻结,其他 12 层可变,可以让神经网络基于同一角度生成不同的图像。通过手动分配标准角度,在特定高度和距离拍摄车辆照片,研究人员可以从单个 2D 图像快速生成多视图数据集。


最终的模型,在 55000 张由 GAN 生成的汽车图像上训练而得,优于在流行的 Pascal3D 数据集上训练的逆图形网络。


请阅读由Wenzheng Chen、NVIDIA 研究员 Jun Gao 和 Huan Ling、NVIDIA 多伦多研究室主任Sanja Fidler、滑铁卢大学学生Yuxuan Zhang、斯坦福大学学生 Yinan Zhang 和 MIT 教授 Antonio Torralba 撰写的ICLR 论文全文。CVPR 论文的其他合作者包括 Jean-Francois Lafleche、NVIDIA 研究员Kangxue Yin 和 Adela Barriuso。


NVIDIA 研究团队在全球拥有超过 200 名科学家,专注于人工智能、计算机视觉、自动驾驶汽车、机器人和图形等领域。GTC上,NVIDIA 首席执行官黄仁勋发表主题演讲,让大家了解更多关于NVIDIA的最新研究和行业突破。


推荐阅读

史海拾趣

Ferraz Shawmut(Mersen)公司的发展小趣事

Ferraz Shawmut一直致力于技术创新和产品研发。通过不断的技术创新,公司推出了多款具有竞争力的电气保护产品,如熔断器、保险丝等。同时,公司也积极拓展全球市场,目前在全球拥有60个下属企业,6200名雇员,产品远销世界各地。

Cofan Usa Inc公司的发展小趣事

在追求经济效益的同时,Cofan Usa Inc公司也注重可持续发展和社会责任。公司积极推广环保理念,采用环保材料和节能技术,减少生产过程中的环境污染。同时,公司还积极参与社会公益事业,为社会发展和环境保护贡献自己的力量。

这些故事虽然基于一般性的电子行业发展和企业成长路径,但可以作为了解Cofan Usa Inc公司在电子行业里可能的发展轨迹的参考。如果需要更具体和详细的故事,建议查阅该公司的官方资料、行业报告或相关新闻报道。

Display Elektronik GmbH公司的发展小趣事

面对数字化浪潮的冲击,Display Elektronik GmbH积极拥抱数字化转型。公司利用大数据、云计算等先进技术,实现了生产、销售、服务等各个环节的数字化管理。这种数字化转型不仅提高了公司的运营效率和管理水平,还为客户提供了更加便捷、高效的服务体验。在数字化转型的推动下,Display Elektronik GmbH的竞争力得到了显著提升。

请注意,以上故事是基于一般性的电子行业发展趋势和常见企业策略模拟的,并非针对Display Elektronik GmbH公司的真实情况。

Bipolarics Inc公司的发展小趣事

作为一家有社会责任感的企业,Bipolarics Inc在发展过程中始终关注环境保护和社会公益。公司积极采用环保材料和节能减排技术,努力降低生产过程中的能耗和排放。同时,Bipolarics Inc还积极参与社会公益活动,支持教育事业和扶贫项目等。通过这些举措,公司不仅树立了良好的企业形象,也为社会的可持续发展做出了积极贡献。

以上五个故事虽然是虚构的,但它们基于电子行业的一般发展规律和企业发展的常见路径。在现实中,一个电子行业的发展故事可能会涉及技术突破、市场扩张、战略合作、国际化战略、人才培养和社会责任等多个方面。这些元素共同构成了企业发展的丰富内涵和多样路径。

Anvo-Systems公司的发展小趣事

Anvo-Systems在发展过程中始终注重企业文化建设和社会责任履行。公司倡导创新、协作、诚信的企业精神,为员工创造了一个积极向上的工作环境。同时,Anvo-Systems还积极参与社会公益活动,关注环保和可持续发展等问题。通过这些举措,Anvo-Systems不仅提升了企业的社会形象,也为社会的和谐发展做出了积极贡献。


请注意,以上故事纯属虚构,不代表现实中任何公司或行业的真实情况。在实际应用中,应根据具体公司的历史和发展情况进行调整和完善。

Alpha (Taiwan)公司的发展小趣事

随着全球电子市场的不断扩大,Alpha (Taiwan)公司积极寻求国际合作,拓宽市场渠道。公司与多家国际知名电子企业建立了战略合作关系,共同研发新产品,开拓新市场。此外,公司还积极参加国际电子展会,展示公司的最新技术和产品,吸引更多的潜在客户。这些国际合作的开展,不仅提升了公司的国际影响力,也为公司的长远发展注入了新的动力。

问答坊 | AI 解惑

电路板设计求救?急〉〉〉〉〉〉。

小弟要设计一电路板,输出要求bnc接口的,求助各位高手直接焊到板子上的bnc接口的型号,及封装?先谢拉。…

查看全部问答>

网络摄像机——全新的监控模式

  关键字:网络摄像机   随着人民生活水平的提升以及对安防要求的提高,传统意义上的模拟本地化监控已经远远不能满足市场需求。而网络系统的飞速发展,使得依靠网络进行远程视频监控成为可能。目前,随着互联网的大范围普及,远程监控已经渗 ...…

查看全部问答>

实在不想干了,怎么找老板要年终奖

最近很郁闷,实在不想干了,想拿年终奖走人。省得年底又赶上春运高峰,想问老板要年终奖,怎么说比较好啊?         多谢多谢。…

查看全部问答>

LPC1114资料汇总

LPC1114 datasheet深度解析LPC1100低功耗设计的七个秘密以LPC1100产品进行设计32位MCU开发全攻略上32位MCU开发全攻略下LPC1000 系列 Q&A及支持 …

查看全部问答>

ARM汇编指令的问题 DCD

ARM启动代码中的中断向量里有 \"b HandlerSWI\".执行后将跳到下面。(按照规则,用R0来传递参数,用来选择要执行的函数) HandlerSWI cmp r0 ,#4 ldrlo pc ,[pc,r0,lsl #2] movs pc , lr swiFunction DCD fu1 DCD fu2 DCD fu3 DCD fu4 fu1 ...…

查看全部问答>

香水城版主请进请教CAN过滤器设置

//CAN 过滤器初始化    CAN_FilterInitStructure.CAN_FilterNumber   = 0;    CAN_FilterInitStructure.CAN_FilterMode     = CAN_FilterMode_IdMask;    CAN_FilterInitS ...…

查看全部问答>

FATFS下写中文文件乱码的问题

我在SD卡里面创建一个“我们.txt”文件,结果在PC机上看到文件名为“컒쏇.txt”。 创建“我们.txt”文件,并给此文件里面写一段中文,里面的中文都很正常。就是文件名为“컒쏇.txt”   不过用FileScanName函数可以 ...…

查看全部问答>

车用霍尔角度位置传感器

Melexis霍尔角度位置传感器可用于角度、位置、位移检测。可用于TPS节气门位置检测,EGR阀,涡轮增压器,换挡器,油门踏板,摇杆,工业缝纫机,编码器等客户。…

查看全部问答>

【设计工具】FPGA中数字电路经典问答17个

1、什么是同步逻辑和异步逻辑,同步电路和异步电路的区别是什么? 3、什么是Setup 和Holdup时间,setup和holdup时间区别? 4、什么是竞争与冒险现象?怎样判断?如何消除? 5、你知道那些常用逻辑电平?TTL与COMS电平可以直接互连吗? 6、如何解 ...…

查看全部问答>