历史上的今天
返回首页

历史上的今天

今天是:2025年01月03日(星期五)

正在发生

2019年01月03日 | 深度强化学习能让机器人拥有人一样的意识

2019-01-03 来源:工程师青青

机器人拥有人一样的意识,一直是我们目前难以攻克的难题。在近日,加州大学伯克利分校的科学家和谷歌人工智能()研究部门之一的Google Brain在Arxiv.org上发表的一份预印本论文中描述了一种人工智能系统,即通过深度强化学习来学习走路,简单来说,就是教“一个四足机器人来穿越熟悉和不熟悉的地形”。

目前,在此预印论文中表示,他们已经研究出了新型算法,并且根据算法演练,实现了机器人自己走路。这也就表明了人工智能系统可以让机器人学会人一样的用灵活的方式掌握和操纵自身或者周围的物体。

随着近几年来,机器人领域的发展和人工智能的崛起,与强化学习被用来处理控制系统面临的难题,尤其是在机器人的灵活操纵方面。

在现实生活中,人们很轻而易举的就将物体堆叠,或者用手工制作各式各样的工艺品,但是一直以来,机器人却一直无法跨越灵活性的鸿沟。

要知道的是,机器人灵活性一直以来就面临很多挑战:

首先,在机器人进行学习时,必须经过自身与环境之间的反复验证,来获取数据。

其次,机器人还得通过自身的观察来导出这些行为,这里面包含了很强的时间相关性。

最后,机器人很容易在环境发生转变之后,其习惯性的行动后果也不可预估。

我们不知道机器人会采取哪些行为,来描述不可预知的事情,所以,人们无法感知违背探索的事物也致使机器人灵活性受到局限。

预印论文中写道:深度强化学习可以用于自动获取一系列机器人任务的控制器,从而实现将感知输入映射到低级别动作的策略的端到端学习。其意思就是,假设机器人在现实世界中可以直接学习运动操纵,那么,每个机器人就能像人一样,获取最适合自己的单个的控制器,从而完成自身敏捷性、稳健性、能源效率上的突破。

深度强化学习可以通过算法来驱动机器人获取大量的数据样本,通过成千上万的模拟实验,来取得最好的结果。

早在2015年,就有科研人员在杂志上发表论文Human-level control through deep reinforcement learning,论文中提出的深度学习和强化学习相结合的思想模型,在Atari游戏平台的演示上,展示出了超越人类水平的表现。

可以预知的是,在未来几年间,深度强化学习能够被应用在不同的领域,例如在视频游戏上、在棋类游戏上、控制复杂的机械操作、调配网络资源、为数据中心大幅节能、对算法自动调参等等。

这种深度强化学习给机器人带来的发展,相信随着时间,也终将会给我们答案。

推荐阅读

史海拾趣

Advanced Semiconductor, Inc.公司的发展小趣事

为了进一步扩大市场份额,ASI积极寻求与全球各大电子企业的合作。通过与这些企业的战略合作,ASI不仅获得了更多的订单和市场份额,还进一步提升了自身的技术水平和创新能力。同时,ASI也积极参与国际半导体行业的交流和合作,与全球同行共同推动半导体技术的发展。

BH Electronics公司的发展小趣事

随着国内市场的饱和,BH Electronics开始寻求国际化发展的道路。公司高层经过深入调研和分析,决定进军欧洲市场。为了适应当地市场的需求和文化习惯,BH Electronics在欧洲设立了研发中心和营销团队,积极推广公司的产品和服务。通过不懈的努力,BH Electronics成功在欧洲市场打开了局面,实现了国际化发展的战略目标。

Digitron公司的发展小趣事

Digitron公司非常重视产品的品质和售后服务。公司建立了严格的质量控制体系,确保每一台出厂的设备都符合高标准的质量要求。同时,Digitron公司还提供全方位的售后服务,包括技术支持、维修保养等,确保客户在使用过程中得到及时、有效的帮助。这种对品质的坚持和对客户的关怀使Digitron公司在客户中树立了良好的口碑。

骅讯(Cmedia)公司的发展小趣事

近年来,随着科技的不断进步和市场的不断变化,骅讯公司也积极寻求创新转型和拓展市场。在保持其在音频芯片设计领域领先地位的同时,骅讯还积极开发新的业务领域,如软件研发、数字内容供应等。这些创新举措不仅为骅讯带来了新的增长点,也为其在电子行业中保持领先地位提供了有力支持。

以上是关于骅讯(Cmedia)公司在电子行业中发展起来的相关故事简要概述。这些故事展示了骅讯如何凭借其技术实力和市场洞察力在竞争激烈的电子行业中不断发展壮大。

厦门法拉(faratronic)公司的发展小趣事

在追求商业成功的同时,FMI公司也积极履行社会责任,致力于环保和可持续发展。公司制定了一系列环保计划和程序,以确保在所有业务运营中保持环保意识。FMI的产品从设计到生产都遵循环保原则,采用环保材料和工艺,减少对环境的影响。此外,公司还积极参与行业内的环保活动,推动整个电子行业的绿色发展。这种负责任的企业形象为FMI赢得了社会的广泛赞誉和尊重。

Fenghua (HK) Electronics Ltd公司的发展小趣事

Fenghua (HK) Electronics Ltd自成立以来,始终将技术创新作为企业发展的核心动力。公司投入大量研发资源,不断推出具有市场竞争力的新产品。其中,一款具有自主知识产权的智能家居控制系统,凭借其独特的智能化和便捷性,在市场上引起了广泛关注。公司通过与国内外知名科技企业的合作,不断引进先进技术和管理经验,提升了整体竞争力。

问答坊 | AI 解惑

锐迪科COM RF收发器实现了射频前端、VCO、环路滤波器等敏感器件的片内集成

新一代无线通信产品的设计越来越复杂,功能也日益强大。作为通信芯片的重要组成部分,高集成度的射频(RF)收发器对于实现多功能、高性能的产品设计至关重要。锐迪科电子有限公司通过采用低成本的CMOS工艺技术,已成功开发出可集成射频前端、VCO、环 ...…

查看全部问答>

飞思卡尔09深圳FTF之行最新资料

飞思卡尔09年最新的消费电子方面的资料打包下载,都是pdf文档,主要是关于飞思卡尔的一些产品在消费电子领域的应用以及技术的解决方案。好资料,需要的网友赶快下啦! …

查看全部问答>

很全的Spartan3E介绍

对初学xilinx公司FPGA的人很有用,…

查看全部问答>

数控直流电流源的设计与实现

本帖最后由 paulhyde 于 2014-9-15 08:54 编辑 在电子设备中经常用到稳定性好、精度高、输出可预置的直流电流源。本文设计的数控直流电流源能够很好地降低因元器件老化、温漂等原因造成的输出误差,输出电流在20mA~2000mA可调,输出电流可预置、 ...…

查看全部问答>

一个菜鸟问题

WinCe应用程序开发。。如果我只想创建一个对话框来做处理。也必须注册和创建窗口吗? 如果一定要这样做的话,那么我又怎么去隐藏掉主窗口而只显示对话框了?确实是个菜鸟问题,麻烦各位大虾解释下。 小弟刚刚开始学习wince。以前都用linux &nb ...…

查看全部问答>

44b0的代码复制部分?

    ;****************************************************    ;Copy and paste RW data/zero initialized data     *    ;************************************************ ...…

查看全部问答>

那个DAVE里面的Debug需要怎么配置啊?

本帖最后由 paulhyde 于 2014-9-15 03:18 编辑 现在正在学习XMC1300,但是用英飞凌官方的编译器时,遇到了一点问题,想求大神给解决一下    …

查看全部问答>

蓝牙透传模式和AT模式的问题

我用透传模式把蓝牙模块和手机蓝牙调通了。 这个蓝牙模块设置好透传模式以后,重新上电后生效。 我想把透传模式改回AT模式,设置好AT模式,重启以后,发现还是 处于透传模式。 是不是这样,两个蓝牙设备配对成功后,就一直处于透传模式? 回不 ...…

查看全部问答>

【LPC54100】LPC54102 M0+包裹已被M4签收!

【LPC54100】LPC54102  M0+包裹已被M4签收! 目的: M0+核间歇性的读取温度,和角度值 ,打包快递(中断)给M4,M4拿过来进行计算! 占用硬件资源   MAILBOX 一、初始化         my ...…

查看全部问答>