历史上的今天
返回首页

历史上的今天

今天是:2025年03月20日(星期四)

正在发生

2019年03月20日 | 国内AI公司发布全新3D人体技术,特效技术有望再次被超越?

2019-03-20

图片来源:视觉中国

只需普通光学摄像头就能构建出你的“3D立体人像”,这是种什么体验?

人工智能平台公司云从科技近日发布了其在3D人体重建技术上取得的

重大突破 。

3月19日,作为“国内CV(计算机视觉)四小龙”之一的云从科技(以下简称云从)宣布,其基于单帧图像的3D人体重建技术刷新了三项世界纪录,这也是继去年云从在3D人脸数据集上大幅刷新纪录后,再次在此类3D重建技术上取得重要成果。

所谓的三项世界纪录,指的是Human3.6M、Surreal和UP-3D三个数据集,是全球关于3D人体重建技术的权威数据集。榜单中的竞争对手包括加州大学伯克利分校、宾夕法尼亚大学、Amazon和Adobe Research等知名企业、研究所与高校。

那么,这项“牛逼”的AI技术到底有哪些应用呢?对于大众而言,3D人体重建技术带来的是全新体验:

这意味着,只用美颜APP就可以完成高精度的全身“瘦身”;你站在镜子前,商场的试衣镜便可实现一秒换装;如果放在电影工业的范畴来看,全新的3D人体重建技术,甚至将超越今年热映好莱坞科幻大片《阿丽塔》中所使用的视觉特效水平(钛媒体曾对该片的特效技术有详细介绍)。

在3D重建领域,误差通常被作为算法能力的主要衡量指标,它指的是生成模型与实际图像的差别。一般来说误差越低,精度越高,技术的性能越好。

云从对钛媒体透露,此次技术突破,“将原有最低误差记录大幅降低30%,使3D人体建模的结果更优秀,更接近人体的实际情况”。以下为云从提供的最低误差记录的信息:

全身精度误差在Surreal上从75.4毫米降低到52.7毫米;

关节精度误差从55.8毫米降低到40.1毫米;

Human3.6M上的关节精度误差从59.9毫米降低到46.7毫米;

除了误差指标,流畅度也是评价技术效果的关键指标。据云从透露,当前人体模型的帧率已经达到了200帧/每秒,相较之下,电影的帧率通常只有24帧/秒,即使对流畅度要求很高的电子游戏,达到60帧/秒就已经非常流畅。在运算速度上,人体建模的耗时也从上百毫秒降低到5毫秒,建模效率更高。

关键指标取得重大突破,加速了3D人体重建的落地进程,但这一概念在大众眼中实属陌生。云从所提出的单帧3D人体重建到底是什么?其革命性到底体现在哪里?

2D向3D飞跃:更精细的人体重建

因为人体有丰富的姿态和穿着,云从提出了一套全新的基于人体3D纵深预测的3D信息表征方式。该技术通过对三原色图像(RGB,不含深度信息)进行分析,预测人体的3D形态和姿势。

这是3D人体重建从2D时代向3D时代的飞跃。

传统的人体关键点检测技术往往监测的是2D的人体骨骼关节点,即通过技术预测RGB图像中人体的十几个关节点的坐标。这种方式存在着不足,其一这样捕捉的节点非常稀疏;其二,这样捕捉的结果一般只包含2D平面的坐标预测,不能还原3D的深度信息,无法体现纵深感。

而基于单帧图像的3D重建技术不仅能输出骨骼关节点信息,更能同时预测大量人体表面的关键点信息,使预测结果更丰富。而且每个点的坐标都是3D呈现,能够体现不同躯干的纵深信息。

人体关键点监测:从2D向3D进化

值得注意的是,云从在新一代3D人体重建技术上,还强调了是“基于单帧图像”。这与传统技术大多需要“连续图像序列”或“多视角图像”产生了鲜明差异。

单帧图像就是一张照片,只需要普通的光学摄像头作为感知设备,就可完成人体重建。而传统技术中对图像要求更高,硬件上需要双目摄像机或者结构光摄像机等设备,在手机端等便携设备上是不可能完成的事。

基于单帧图像的3D重建技术降低了设备使用门槛,也对背后的技术提出了更难的挑战。该技术需要从单帧图像中推理出人体或人脸的3D形态,并通过“光学透视”、“阴影叠加”等基本光学原理预测各个关键点在3D空间的位置和朝向,从而得到人体的姿态或表情信息。

工业电影特效或被颠覆?

云从科技对钛媒体罗列了上述技术可能的落地场景。在C端的应用上,如上文提到,在不需要结构光的条件下,高精度全身瘦身可以通过手机App完成、并进行动画合成操作;智能换装也将成为普及性的体验。

其技术原理是,精度和显示效果大幅提升,设备门槛得以降低,将推动3D人体重建技术的落地步伐。

此外,还可以应用于疑犯身份重建、医疗仿真肢体3D重建以及电影特效领域。

视觉盛宴的缔造者《阿凡达》、《阿丽塔》等影片,不断抬高着人们挑剔的审美品位。未来,如果3D人体重建技术应用于电影特效制作,不仅会颠覆传统的特效技术,更会直接提升工业电影的制作水平。

《猩球崛起》CG特效

20世纪90年代,影视特效往往采用的是光学式动作捕捉。在动作捕捉中,演员要穿上带有特定感应器的紧身衣,感应器会捕捉演员动作并同步给电脑中的虚拟角色,使得虚拟动作与真人动作完全同步。鲜为人知的是,1996年卡梅隆在制作《泰坦尼克号》时,沉船场景中的大多数乘客就都是CG人物。

2001年的《指环王》可谓是动作捕捉技术发展的分水岭;不过当时的技术还停留在捕捉头、四肢这样较大身体部位的水平,CG人物的表情还需要手工制作。

自《阿凡达》开始,特效技术开始从“动作捕捉”转向“表情捕捉”,《阿丽塔》则是实现了从“动作捕捉”到“表情捕捉”的彻底跨越。

《阿丽塔》CG特效图

在此前接受钛媒体专访时,好莱坞金牌特效团队“维塔数码”曾阐释了“表情捕捉”的优势,“所谓表演捕捉,就是不局限于四肢打斗几个固定散点的移动捕捉,全身上下还增加了好几倍的、更密集的感应点,也包括对面部表情的捕获。”

在这类特效电影中,对人像进行动作和表情捕捉,需要用专业的特效设备和面部贴点来进行。而3D人体重建技术颠覆了传统的技术,使得人体建构更加流畅饱满。根据云从科技提供的数据,当前3D人体重建技术能够用6万多个点完整描绘人体,在速度和精度上都有突破,人体模型建构也会更精细。

这不仅能降低工业级3D动画合成的门槛,也将会对工业电影的特效带来革命性的影响。

2018年10月,云从科技已完成 B+轮融资,金额超过 10 亿元。自2015年正式成立以来,云从已完成 4 轮融资,累积融资额已超过35亿元。


推荐阅读

史海拾趣

Axon' Cable公司的发展小趣事

品质是Axon' Cable公司的生命线。公司始终坚持以客户需求为导向,不断提升产品品质和服务水平。Axon' Cable建立了完善的质量管理体系,并通过了多项国际认证。同时,公司还注重持续改进和创新,不断优化生产流程和提高生产效率。这些努力使得Axon' Cable的产品在品质上始终保持领先地位,赢得了客户的信任和好评。

这些故事虽然无法涵盖Axon' Cable公司发展的全部细节,但试图展现了其在电子行业中的成长轨迹和取得的成就。通过这些故事,我们可以看到Axon' Cable公司凭借其坚定的信念、不懈的努力和创新精神,在电子行业中不断发展壮大,成为了一家具有全球影响力的知名企业。

BSI公司的发展小趣事

近年来,随着环保意识的提高,电子行业对绿色发展的需求也日益迫切。BSI积极响应这一需求,推动了电子行业绿色标准的制定和实施。通过制定严格的环保标准,BSI引导电子产品制造企业采用更加环保的生产工艺和材料,减少了对环境的污染。同时,BSI还为企业提供了碳排放核查等服务,帮助企业了解自身的碳排放情况,制定了减排措施,推动了电子行业的绿色发展。

Eaton公司的发展小趣事

在伊顿的发展历程中,合作伙伴起到了至关重要的作用。伊顿一直秉持开放合作的态度,与全球各地的企业和机构建立了广泛的合作关系。通过与合作伙伴的共同努力,伊顿不仅在技术和产品上取得了突破和创新,还实现了市场份额的快速增长和业务的全球化拓展。例如,伊顿与天合智慧达成的战略合作伙伴关系,就是双方共同推动分布式光伏产业发展的有力证明。这一合作不仅为双方带来了共赢的机会,也为全球能源结构的转型和升级做出了积极贡献。

以上五个故事涵盖了伊顿公司在电子行业中的发展历程、在中国市场的拓展、与绿色能源的结合、在商用车领域的发展以及与合作伙伴的共赢等多个方面。这些故事不仅展示了伊顿公司的实力和成就,也体现了其不断创新和追求卓越的精神。

Delta Electronics Manufacturing Corp公司的发展小趣事

品质是Delta的生命线。公司建立了完善的质量管理体系,从原材料采购到生产过程的每一个环节都进行严格的质量监控。此外,Delta还注重可持续发展,积极推广环保理念,采用环保材料和节能技术,降低产品对环境的影响。这些措施不仅提高了产品的质量,也为企业赢得了良好的社会声誉。

FEMA Electronics Corporation公司的发展小趣事

FEMA在追求经济效益的同时,也积极履行社会责任。公司积极参与公益事业和慈善活动,为社会做出了积极贡献。同时,FEMA还注重环保和可持续发展,努力降低生产过程中的能耗和排放。这些举措不仅提升了公司的社会形象,也为公司的长期发展奠定了坚实的基础。在履行社会责任的过程中,FEMA实现了经济效益和社会效益的双赢。

德丰(DEFOND)公司的发展小趣事

台湾德丰股份有限公司(简称“台湾德丰”)自1961年成立以来,一直专注于房屋租售、商业大楼兴建等房地产相关业务。公司在长期的经营过程中,形成了稳健的发展风格和良好的市场口碑。台湾德丰凭借专业的服务团队和丰富的市场经验,成功在竞争激烈的房地产市场中占有一席之地。公司的发展不仅为员工创造了良好的工作环境和福利待遇,也为当地经济的发展做出了积极贡献。

问答坊 | AI 解惑

网络下载WINCE BIN报错,那位大侠能帮忙分析下

求助:我通过platform builter5.0下载WINCE nk.bin文件到ARM板中,提示如下错误: Warning:  Debugger service map is set to none.  If your image has debugging support it may not boot properly. Cannot access selecte ...…

查看全部问答>

基于SEED-DIM3517的网络电视机

基于SEED-DIM3517的网络电视机 [ 本帖最后由 youki12345 于 2010-11-9 15:17 编辑 ]…

查看全部问答>

lcd彩屏显示汉字问题

主要程序字库定义typedef struct typFont16    // 汉字字模数据结构 {    signed char Index[2];  //汉字     uc16 Msk[16] ...…

查看全部问答>

版主这个时序定时器要怎么配置才能实现

版主这个时序怎么定时器要怎么配置才能实现啊! 下载 (21.83 KB) 2010-3-1 14:41 …

查看全部问答>

从51到ARM,当然要从Cortex-M0开始!

Q1:Cortex-M0是什么?A:它是ARM公司为了占领单片机市场而推出的一款极具竞争力的MCU,该处理器是现有的最小、能耗最低和能效最高的 ARM 处理器。该处理器硅面积极小、能耗极低并且所需的代码量极少,这使得开发人员能够以 8 位的设备实现 32 位设备 ...…

查看全部问答>

Smart Grid and Renewable Energy《智能电网与可再生能源》期刊导读

Smart Grid and Renewable Energy《智能电网与可再生能源》期刊导读 ISSN: 2151-481X (Print) 2151-4844 (Online).《智能电网与可再生能源》SGRE免费下载网址: http://www.scirp.org/journal/sgre.   Table of Contents(Vol.02 No.02, May ...…

查看全部问答>

我的5110画图库--Nokia 5110液晶屏实现画点、画线、画矩形、画圆和画图

  最近花了好多时间终于完成了5110液晶屏的画图函数库,完善了画图的基本函数,有画点,画直线,画折线,画矩形,画圆和贴图的基本功能。函数库提供了使用缓冲区和不使用缓冲区的函数,可以根据需要灵活使用。单片机使用的是stm32,但是 ...…

查看全部问答>

芯朋微LED照明解决方案

芯朋微提供全面的LED照明解决方案,请大家参考,也希望能与我交流,谢谢。QQ:2217142156…

查看全部问答>

国家电网公司科技部下达2014年度公司技术标准制修订计划

近日,国家电网公司科技部下达2014年度公司技术标准制修订计划,共计306项技术标准制修订项目和6项技术标准专项研究项目获批立项。     其中中国电科院牵头的109项技术标准制修订项目于此次获批立项,占公司技术标准制修订项目总数的36% ...…

查看全部问答>

TMS320C6713B捕获脉冲上升沿和下降沿

请问各位高人: 本人之前主要使用TI2000系列,现刚接触6000系列不久,请问如何用TMS320C6713B捕获外部脉冲的上升沿和下降沿。…

查看全部问答>