历史上的今天
返回首页

历史上的今天

今天是:2025年01月10日(星期五)

正在发生

2020年01月10日 | 解决机器人控制问题 能很好的处理离散和连续动作空间

2020-01-10 来源:中国机器人网

机器人技术的基本问题既涉及离散变量(比如控制模式或齿轮切换的选择),又涉及连续变量(比如速度设定点和控制增益)。通常来说,由于算法或控制策略并不总是适合的,因此这些问题很难解决。这就是为什么谷歌母公司Alphabet的Deepnd的研究人员最近提出了一种技术:连续-离散混合学习,即可以同时优化离散和连续动作,以其本来的形式处理混合问题。

在预印本服务器Arxiv.org上发表的一篇论文详细介绍了他们的工作,这篇论文也在去年10月日本大阪的第三届机器人学习会议上被人接受。写道:“许多先进的方法都进行了优化,它们能很好处理离散的或是连续的动作空间,但是却很少有方法能同时处理。能够使用同一算法强大地处理离散和连续动作空间,使我们能够针对任何给定问题都能选择最自然的解决方案策略,而不是让算法上的便利性来决定做出哪种选择。”

团队研发的无模型算法,是指利用强化学习或者奖励实现目标的自主代理人的培训技术,通过连续和离散动作空间来解决控制问题,并通过受控和自主切换来解决混合最优控制问题。此外,这种算法通过使用“元动作”或其他类似方案来扩大动作空间(分别定义了代理人可能感知和采取的状态和动作的范围),从而为解决现有的机器人问题提供了新颖的解决方案,并使策略可以解决类似人工智能训练期间的机械磨损等挑战 。

研究人员在一系列模拟和现实基准中验证了他们的方法,包括Rethink Robocs公司的Sawyer机器人手臂。据称,基于给定的到达、抓取和拿起魔方的任务,其中奖励是三个子任务的总和,因此他们的算法要优于无法解决任务的现有方法。

那是因为到达魔方需要代理人打开手臂的抓具,而抓取方块需要关闭抓具。作者写道:“一开始,基线将大部分概率集中在较小的动作值上,因此很难移动抓具的手指来看到任何奖励,从而解释了学习曲线上的平稳期。另一方面,这个算法能始终以全速操作抓具,因此改进了探查性,使机器人可以完全完成任务。”

在一个单独的实验中,团队将其算法设置为参数化动作空间马尔可夫决策过程(PAMDP)或一个分层问题,其中,代理人首先选择离散动作,然后为该动作选择一组连续的参数集。在这种情况下,代理人的任务是操纵机器人手臂,以便将钉子插入孔中,然后根据孔的位置和运动学来计算奖励。

研究人员表示,他们的方法比精细方法和粗略方法获得了更大的回报,并且这种算法将来可以作为基础应用到更多的混合强化学习中。论文中写道:“对于专业设计师而言,事先选择合适的模式可能很困难。而我们的方法是很有用的,因为它只需要一个实验,而别的方法都需要通过消融来进行验证。”

推荐阅读

史海拾趣

Franz Binder GmbH & Co公司的发展小趣事

Franz Binder GmbH & Co公司的发展故事

故事一:初创与奠基

Franz Binder GmbH & Co公司,简称宾德集团,成立于1960年,由Franz Binder在德国创立。起初,公司仅是一个机械加工车间,专注于加工车削件。然而,随着技术的不断积累和市场需求的增长,宾德开始专注于圆形连接器的生产。1967年,公司成功生产出第一只连接器,这标志着宾德正式进入连接器制造领域。此后,宾德不断投入研发,提升产品质量,逐渐在行业内崭露头角。

故事二:全球化布局

随着业务的不断扩展,宾德集团开始寻求全球化发展。1979年,宾德在瑞士成立了分公司Binder Electronic Components,标志着公司正式走向世界。此后,宾德在全球范围内迅速扩张,相继在美国、中国、法国、瑞典、英国、新加坡、荷兰和韩国等国家成立了子公司,并与全球45个经销商建立了合作关系。这一全球化布局不仅提升了宾德的品牌影响力,还为公司带来了更多的市场机会。

故事三:技术创新与产品多样化

宾德集团始终将技术创新视为企业发展的核心动力。公司不断投入研发资源,推出了一系列具有创新性的连接器产品。从微型连接器到电源连接器,再到医疗设备连接器和自动化技术连接器,宾德的产品线日益丰富,满足了不同行业的需求。特别是在工业自动化领域,宾德连接器以其高可靠性、高传输率和易于安装的特点,赢得了众多客户的青睐。

故事四:品质与认证

品质是宾德集团赖以生存和发展的基石。公司始终坚持高标准、严要求,确保每一件产品都符合国际质量标准。为此,宾德不仅通过了ISO 9001和ISO 14001等国际质量管理体系认证,还获得了UL、VDE和ESTI+等多项国际认证。这些认证不仅证明了宾德产品的卓越品质,也为客户提供了更多的信心和保障。

故事五:中国市场的发展

中国作为全球最大的电子市场之一,对宾德集团的发展具有重要意义。2001年,宾德在中国成立了全资子公司——南京宾德电气有限公司(宾德中国),负责中国地区的销售和客户服务。自成立以来,宾德中国凭借优质的产品和服务,迅速赢得了中国市场的认可。特别是在智能制造、自动化技术和医疗等领域,宾德连接器的应用越来越广泛,为中国电子行业的发展做出了积极贡献。

API Technologies公司的发展小趣事

作为一家有社会责任感的企业,API Technologies不仅关注经济效益,也积极履行社会责任。公司注重环保和可持续发展,在生产过程中采取了一系列环保措施,降低能耗和排放。同时,公司还积极参与社会公益活动,回馈社会,为社区的繁荣和发展做出了贡献。

这些故事展示了API Technologies在电子行业中的发展历程和取得的成就。通过不断创新、全球化布局、品质管理和履行社会责任,公司逐渐成为了电子行业的佼佼者。

GE Power Electronics Inc公司的发展小趣事
作为儿童玩具的一部分,通过声音控制播放音乐,增加玩具的趣味性和互动性。
AURORA公司的发展小趣事

AURORA公司深知自动驾驶技术的商业化落地需要与汽车制造商紧密合作。因此,AURORA积极与大众汽车集团、现代汽车等多家知名汽车制造商建立合作关系。通过共同研发和推广自动驾驶技术,AURORA成功帮助这些汽车厂商加速各自自动驾驶汽车的商用计划。这种深度合作不仅提升了AURORA的市场影响力,也为公司的长期发展奠定了坚实基础。

Global Specialties公司的发展小趣事

随着电子技术的快速发展,教育和培训成为了Global Specialties的另一个重要领域。公司敏锐地捕捉到这一市场需求,推出了一系列针对教育的试验板和套件。这些产品不仅帮助学生更好地理解电子原理,还激发了他们的创造力和实践能力。通过与多所高校和职业院校的合作,Global Specialties成功地将自己的品牌深入到教育市场的每一个角落。

Hei Inc Optoelectronic Division公司的发展小趣事
无触点控制电路减少了机械触点的使用,避免了因触点磨损、氧化或接触不良导致的故障,从而提高了设备的整体可靠性和稳定性。

问答坊 | AI 解惑

汽车电磁兼容术语介绍

◎电磁干扰(EMI, Electromagnetic Interference):任何可能会降低某个装置、设备或系统的性能,或可能对生物或物质产生不良影响之电磁现象。一般而言,电磁干扰又可以区分为辐射干扰与传导干扰二种。   ◎电磁耐受(EMS, Electromagn ...…

查看全部问答>

AD834发热

用AD834搭一个乘法器,可是搭好后工作时AD834发热。其实发热也不很厉害,关键是数据会跟着漂移。电路也没问题,完全按照手册给的参数搭接的。请各位高手支招。另外AD834是否应该加散热器,如何装?…

查看全部问答>

山寨手机遭3G“逼宫” 无生存土壤将被淘汰

自2008下半年以来,山寨手机已遭遇了一场全国性“围剿”.随着监管部门加强IMEI管理,山寨手机将面临更大的监管压力,但这也给了山寨手机发展机遇.希望山寨手机能够走好转型升级之路,走出山寨. 山寨手机近两年达到发展的高峰.根据赛迪顾问统计,山寨手 ...…

查看全部问答>

辩论-ARM7过时了Cortex才是王道?

好不容易把ARM7学会了,最近有听很多人说,ARM7已经过时。Cortex才是最终的发展方向?你怎么看能,说是你的看法???…

查看全部问答>

急!!!!!!跪求各位高手关于LCD的屏幕控制问题

我写了一个算式 在1602的第一行输入(1+2*(sin1.57+6)-2)*3= 然后交给单片机进行计算 但是第一行输入的数据超过了屏幕显示的范围,整屏移动了 我先写了write_cmd(0x80+0x40) 然后写了write_cmd(0x02),我记得这个命令就可以让指针回车换行 ...…

查看全部问答>

求助:SIM300发彩信的控制程序

谁有WINCE下,控制SIM300发彩信程序,发我邮箱,谢谢!wxs0319@163.com…

查看全部问答>

NANDflash坏块标志疑问?

    我用的是K9F1208UOB.三星在出厂前对坏块进行标志。DATASHEET上说是,每个BLOCK的第一或者第二页的第517字节会有非FF数据的坏块标志。但我在友善以及立于泰等开发板的FMD_GetBlockStatus()函数中都只对第一页进行判断,万一坏块标志不 ...…

查看全部问答>

招聘嵌入式工程师

岗位要求: 1.        两年以上嵌入式ARM系统开发经验; 2.        精通嵌入式linux系统内核,有从事嵌入linux的裁剪、移植的工作经验,能够熟练地根据硬件平台定制linux系统; 3.    &nb ...…

查看全部问答>

5M带宽有源滤波器

本帖最后由 paulhyde 于 2014-9-15 09:00 编辑 想做一个5M带宽的有源滤波器,但是不知道有没有集成芯片能实现该功能,希望各位大侠帮帮忙提点下~~~急用!  …

查看全部问答>

28335计算正余弦函数的时间?

请教下各位一个问题:         在28335中直接调用sin 或cos 函数计算一次大概需要多少时间?         我在dsp中编写了一个简单的小程序,运算100次sin(x),然后toggle- ...…

查看全部问答>