历史上的今天
今天是:2025年01月03日(星期五)
2019年01月03日 | 深度强化学习能为机器人注入“灵魂”
2019-01-03 来源:OFweek机器人网
机器人拥有人一样的意识,一直是我们目前难以攻克的难题。在近日,加州大学伯克利分校的科学家和谷歌人工智能(AI)研究部门之一的Google Brain在Arxiv.org上发表的一份预印本论文中描述了一种人工智能系统,即通过深度强化学习来学习走路,简单来说,就是教“一个四足机器人来穿越熟悉和不熟悉的地形”。
目前,在此预印论文中表示,他们已经研究出了新型算法,并且根据算法演练,实现了机器人自己走路。这也就表明了人工智能系统可以让机器人学会人一样的用灵活的方式掌握和操纵自身或者周围的物体。
随着近几年来,机器人领域的发展和人工智能的崛起,深度学习与强化学习被用来处理控制系统面临的难题,尤其是在机器人的灵活操纵方面。
在现实生活中,人们很轻而易举的就将物体堆叠,或者用手工制作各式各样的工艺品,但是一直以来,机器人却一直无法跨越灵活性的鸿沟。
要知道的是,机器人灵活性一直以来就面临很多挑战:
首先,在机器人进行学习时,必须经过自身与环境之间的反复验证,来获取数据。
其次,机器人还得通过自身的观察来导出这些行为,这里面包含了很强的时间相关性。
最后,机器人很容易在环境发生转变之后,其习惯性的行动后果也不可预估。
我们不知道机器人会采取哪些行为,来描述不可预知的事情,所以,人们无法感知违背探索的事物也致使机器人灵活性受到局限。
预印论文中写道:深度强化学习可以用于自动获取一系列机器人任务的控制器,从而实现将感知输入映射到低级别动作的策略的端到端学习。其意思就是,假设机器人在现实世界中可以直接学习运动操纵,那么,每个机器人就能像人一样,获取最适合自己的单个的控制器,从而完成自身敏捷性、稳健性、能源效率上的突破。
深度强化学习可以通过算法来驱动机器人获取大量的数据样本,通过成千上万的模拟实验,来取得最好的结果。
早在2015年,就有科研人员在《自然》杂志上发表论文Human-level control through deep reinforcement learning,论文中提出的深度学习和强化学习相结合的思想模型,在Atari游戏平台的演示上,展示出了超越人类水平的表现。
可以预知的是,在未来几年间,深度强化学习能够被应用在不同的领域,例如在视频游戏上、在棋类游戏上、控制复杂的机械操作、调配网络资源、为数据中心大幅节能、对机器学习算法自动调参等等。
这种深度强化学习给机器人带来的发展,相信随着时间,也终将会给我们答案。
上一篇:一文看懂AGV为何会“红”?
史海拾趣
|
关键字:红外防水摄像机 现在的普通红外防水摄像机,一般采用光敏元件来探测所处环境的照明强度,根据设计参数中确定的阈值,产生控制信号,实现红外灯的开启。阈值的高低,由使用的环境,用户的喜好,设计人员考虑各 ...… 查看全部问答> |
|
不知道让不让发招聘信息,太着急了,发了再说。版主见谅呀。 联系方式: Tony Chen 陈庚 Cell Phone: 13466559150 Phone: 010-62101278 Msn: r59208@hotmail.com Embedded SW Engineer Job description ? As ...… 查看全部问答> |
|
我这台电脑有点郁闷,安装EVC只有 每次启动很久才进入桌面, 右下角,老是有个什么visual emulator 阻止系统加载的汽包提示。 EVC倒是能正常使用,我把EVC卸载了,这个东西还是会弹出来,启动还是很慢,请问有什么办法,彻底删除这个东西?… 查看全部问答> |
|
我用的是2440CAM接口,数据格式是16bit RGB565,8位的数据通道,请问在一个PCLK下降沿传输的那8位数据是什么东西? 我的理解是:那8位是R5+G3,之后下一个PCLK是G3+B5,这样两个PCLK传输了一个像素,也是这一张图的第一个像素,之后存入帧存储器了, 根据24 ...… 查看全部问答> |
|
开发平台 :wince 开发环境 :evc++ 4.0,sp4 socket 服务器端 .net 2.0 (c#) 基于gprs 无线网络的远程文件下发和程序升级系统 有意联系 :email : acosoft@163.com… 查看全部问答> |
|
快到年关了,项目上非常忙,很久没来了。今天抽空把俺用LM3S8962开发板做的串口服务器Telnet协议部分整理了一下。 这个串口服务器用来将telnet发送的指令通过串口转发到对应的设备,来获取设备状态和控制设备。比如查看设备的电流,电压和 ...… 查看全部问答> |
|
TPLink wr703n 无线小路由刷OPENWRT 不需要拆机 4M 经常可以在各种渠道看到基于OPENWRT的DIY,而且很多作品的使用性很强,而且这个基于Linux的开源系统,最关键的是在很多廉价的路由中就可以容易刷入OPenWRT,所以这是一个可玩性很强的系统。最近我们论坛的网友也有这方面 ...… 查看全部问答> |




