历史上的今天
今天是:2024年09月14日(星期六)
2019年09月14日 | 自然语言和三维姿态模型结合,AI研究者将文字转成肢体语音
2019-09-14 来源:爱集微
卡内基梅隆大学(Carnegie Mellon University)的人工智能研究人员发明了一种人工智能代理,能够将文字转化成身体动作。这种方法被称为Joint Language-to-Pose,或JL2P,它将自然语言与三维姿态模型相结合。
JL2P动画目前仅限于简笔画,但将文字翻译成类似人类动作的能力有朝一日可以帮助类人机器人在现实世界中执行物理任务,或帮助创意人员为视频游戏或电影等制作虚拟人物动画。

JL2P能够做一些比如走路或跑步,演奏乐器(如吉他或小提琴),遵循方向指示(左或右),或控制速度(快或慢)的动作。这项研究最初发布于arXiv.org上的一篇论文,并且将于9月19日在魁北克举行的3D视觉国际会议上由CMU语言技术研究所的研究员柴坦雅·阿胡亚(Chaitanya Ahuja)与合作者共同发表。
“我们首先根据完整的指令来预测动作序列从而优化模型,”论文写道。这个简单的任务可以帮助模型学习非常短的姿势序列,比如走路时的腿部动作、挥手时的手部动作和弯曲时的躯干动作。研究人员声称,与SRI国际研究人员2018年提出的最先进的人工智能相比,JL2P在人体运动建模方面有9%的提升。
据了解,JL2P使用KIT动作语言数据集进行训练。该数据集由德国高性能仿人技术公司(High Performance Humanoid Technologies)于2016年推出,将人体运动与自然语言描述相结合,将长达11小时的人类运动记录映射到大约6200多个以8个单词成一句的英语句子中。
史海拾趣
|
在ISSCC大会开幕的头一天晚上,按照惯例举办了一场晚间技术研讨会。其中,由模拟技术研究领域的著名研究员们进行研讨的模拟电路技术专题研讨会,是每次都有众多人员参加的重头会议。今年的主题是“模拟电路设计的黄金时代结束了吗?(Is the Golden ...… 查看全部问答> |
|
本帖最后由 jameswangsynnex 于 2015-3-3 20:00 编辑 请大家继续追加、我会整理出清单。 一、国内TV DESIGN HOUSE: 上海这边的有全景、 奇普、英诺、pixelworks、 trident、ST、高清、 天柏、复旦微电子、先锋、上广电、大亚、戎讯、协和、华 ...… 查看全部问答> |
|
在EasySys中,在内核用了一个MessageBox,系统蓝屏了,哦也.. 在内核模式可以调用win32api吗?为什么可以/不可以? 另外,有没有关于内核函数的查阅文档?最好是chinese..谢谢… 查看全部问答> |
|
在很多项目中我们都需要菜单,特别是多层菜单应用比较广泛,但是写一个能够很方便移植的多层菜单非常麻烦,我们这里就先研究一下单层菜单的翻滚的实现方式。 下面就以一个例子来说明此菜单的具体实现方法: 1. 假设本菜单使用在1 ...… 查看全部问答> |
|
【设计工具】Xilinx新版FPGA设计工具使FPGA可重复编程 赛灵思(Xilinx)公司推出新版FPGA设计的实时调试和验证软件。该公司的ChipScope Pro 6.2i使FPGA可重复编程,对于逻辑和嵌入式系统的调试可灵活和快速地完成。该软件的主要性能是附加了ATC2核,可将ChipScope Pro 6.2i与Agilent公司的16900、1690和16 ...… 查看全部问答> |




