历史上的今天
返回首页

历史上的今天

今天是:2025年02月08日(星期六)

正在发生

2018年02月08日 | 研究人员开发出新算法 像训练狗一样训练机器人

2018-02-08 来源:AI行者

美国陆军研究实验室(ARL)和德克萨斯大学(UT)奥斯汀分校的研究人员已经开发了新的机器人或计算机程序技术,以学习如何通过与人类指导员进行交互来执行任务。这项研究的结果于2月2日至7日在路易斯安那州新奥尔良的人工智能促进协会论坛上公布。

ARL和UT研究人员考虑了一个特定的情况,即人以评论的形式提供实时反馈。奥斯汀得克萨斯大学的合作者Peter Stone博士和他的前博士生Brad Knox首先研发的TAMER,或者通过评估强化手动培训机器人人,由ARL/UT团队开发了一种新的算法叫Deep TAMER。

这是TAMER的扩展,采用深度学习,它的灵感来源于人类的大脑,让机器人可以获得通过短时间观看视频来获得执行任务的能力。

据军方研究员Garrett Warnell博士表示,研究小组认为,一个人通过观察和提供评论(例如,“好工作”或“糟糕的工作”)来教导机器人如何做事,就像人类训练狗去变戏法一样。Warnell说,研究人员延伸了这个领域的早期工作,使这种类型的机器人或计算机程序的培训,通过图像看世界,这是设计可以在现实世界中运行的学习代理的重要第一步。

目前人工智能中的许多技术要求机器人在较长的时间内与环境进行交互,以学习如何最佳地执行任务。在这个过程中,机器人人可能会执行一些不仅可能是错误的行为,例如机器人在墙上跑步,而且可能会发生像机器人跳下悬崖等灾难性的事故。Warnell表示,来自人类的帮助将加快机器人的成长速度,并帮助他们避免潜在的陷阱。

作为第一步,研究人员展示了Deep TAMER的成功,通过15分钟的人为反馈来训练代理人在Atari保龄球游戏中比人类更好的表现,这个任务对于即使是最先进的人工智能方法而言也是非常困难的。Deep-TAMER训练的机器人展示出了过人的表现,甚至优于他们的业余训练师以及专家级人类Atari玩家。

左:ARL的研究员Garrett Warnell博士,右:德克萨斯大学(UT)奥斯汀分校教授Peter Stone博士

在未来一到两年中,研究人员有兴趣探索他们的最新技术在更广泛的环境中的适用性:例如除了Atari Bowling以外的视频游戏和更多的仿真环境,为真实世界中的机器人找到更好类型的代理和环境。

Warnell表示,“未来的军队将由士兵和自主队友并肩作战,尽管人类和自主机器人都可以提前接受培训,但他们有可能在完全陌生的新环境中执行搜索、营救或监视等任务,在这种情况下,人类可以很好地利用训练随机应变,而现在的人工智能机器人还做不到。”

Deep TAMER是研究人员设想的一系列研究的第一步,将使陆军中更加成功的人类-自主机器人团队成为可能。最终,他们需要自主的机器人人,能够以各种各样的形式,如演示、自然语言指导和评论,快速而安全地从他们的人类队友学习。

来源:极客网

推荐阅读

史海拾趣

Elcos AG公司的发展小趣事

随着国内市场的饱和,Elcos AG开始寻求国际化拓展的机会。公司首先在欧洲市场建立了销售网络,通过与当地合作伙伴的紧密合作,逐渐打开了欧洲市场的大门。随后,Elcos AG又将目光投向了亚洲和北美市场,通过设立海外办事处和参加国际展会等方式,积极推广公司品牌和产品。在国际市场的竞争中,Elcos AG凭借其卓越的产品品质和完善的售后服务体系,赢得了众多客户的信赖和支持。

Hasco Relays and Electronics International Corp公司的发展小趣事

作为L3Harris Technologies的一部分,Harris(原Harris Corporation)在太空和航空领域也取得了重大突破。公司参与了多个太空任务和航空项目,为这些项目提供了先进的航天器和航空电子系统。这些系统不仅支持了复杂的航天任务,还提升了航空器的性能和安全性。L3Harris在太空和航空领域的持续投入和创新,为其在电子行业中的发展注入了新的动力。

CST Master Electronic Co Ltd公司的发展小趣事

随着市场的不断发展,CST Master意识到只有不断创新才能在激烈的竞争中立足。公司投入大量资源用于研发,积极探索新技术、新工艺和新材料。经过多次试验和失败,团队终于取得了一项重要的技术突破,推出了一款具有行业领先水平的新产品,赢得了客户的广泛认可。

Amveco Toroidal Power Products公司的发展小趣事

为了进一步扩大市场份额,Amveco公司积极寻求与行业内外的合作伙伴建立战略合作关系。公司与多家知名的电子设备制造商建立了长期稳定的合作关系,为其提供定制化的环形变压器解决方案。此外,公司还通过参加国际电子展会、建立海外销售网络等方式,积极开拓国际市场,实现了业务的全球化布局。

广芯电子(BROADCHIP)公司的发展小趣事

为了进一步扩大市场份额,Amveco公司积极寻求与行业内外的合作伙伴建立战略合作关系。公司与多家知名的电子设备制造商建立了长期稳定的合作关系,为其提供定制化的环形变压器解决方案。此外,公司还通过参加国际电子展会、建立海外销售网络等方式,积极开拓国际市场,实现了业务的全球化布局。

启英泰伦(Chiplntelli)公司的发展小趣事

近期,启英泰伦完成了数千万元的B++轮融资,由水木春锦资本、盛裕资本和自觉资本共同投资。这笔资金将主要用于产品的大规模量产和新产品的研发,以进一步加速启英泰伦在智能语音芯片市场的布局。资本的注入不仅为公司的发展提供了强有力的支持,也反映了市场对启英泰伦技术和市场前景的认可。

问答坊 | AI 解惑

proteus仿真中有湿度传感器吗?

大家有没有用过啊,可不可以把源程序让我参考一下?对单片机对外部计数不是太懂,是不是要查询TF1(或TF0)为1啊,那么不同频率,如何计数呢?…

查看全部问答>

verilog设计经验总结

本贴转自网络,不知原创于何处,粘贴于此:http://hi.baidu.com/icc%5Ffuzhou/blog/item/8c73b731e8ac821feac4afd5.html 其中有很多都是我在实际的fpga设计中用到的,比起书本来的实在,现在分享给大家: 先记下来: 1、不使用初始化语句; 2、 ...…

查看全部问答>

台湾新茂(SyncMOS)与爱特梅尔(ATMEL) 8051内核单片机替换

台湾新茂(SyncMOS)与爱特梅尔(ATMEL)8051内核单片机替换表SM8952AC40PP/JP/QP=AT89S52-24PU/JP/AUSM8958AC40PP/JP=AT89C55WD-24PU/JPSM894051C25PP/SP=AT89C2051-24PU/SUSM894051C25PP/SP=AT89C4051-24PU/SU深圳市鼎尚电子有限公司,新茂大陆代理商 ...…

查看全部问答>

PXA310是工业级别的吗?

我看了下说明,温度范围 -25 - 85 °C。不知道有没有工业界别的?…

查看全部问答>

WINCE6如何把DLL加载到内核

loadkernellibrary //吗? 复制代码 给个例子参考?…

查看全部问答>

各位大侠帮帮忙

我的电脑没有串口应该怎么接到DP51单片机仿真实验仪??…

查看全部问答>

如何让我的设备驱动程序不能被卸载?

如何让文件过滤驱动程序(WDM)安装后不能被Windows卸载,只能被我提供的程序卸载,请高手多指教!!!…

查看全部问答>

关于SPI长时间通讯的问题

最近在做一个SPI通讯的实验,SPI边发边收且循环执行,刚开始程序运行正常,但是运行几个小时后程序就卡在while(!SPIS_SPRF)那里跳不出来了,至今找不到问题。求高人指点啊,小弟谢谢了。 /******************************************************* ...…

查看全部问答>

请问行家沉金的PCB能保存多久呢?

如题是沉金工艺加工的PCB,不知道需要多久之内使用完呢?如果过期了,还能重新做处理吗?期待行家的解答。…

查看全部问答>