历史上的今天

今天是：2025年05月31日（星期六）

2018年05月31日 | AI在机器人运动控制领域应用盘点

2018-05-31 来源：亿欧网

复杂机器人的运动控制，一直阻挡机器人产业发展的老大难问题，迟迟没有得到很好的解决。即便是代表机器人最高水平的波士顿动力，其机器人离实用也还远。近两年发展迅猛的AI，俨然如万金油般，被用在各种地方，自然也包括机器人控制领域，而且似乎取得了不错的效果。前端时间，UCberkely的强化学习专家Pieter Abbeel创办了Embodied Intelligence，业务更是直接涵盖了VR、AI、机器人三大热点。

为了搞清楚VR、AI等新技术如何在机器人控制领域应用，本文根据一些相关论文和公开资料，包括Pieter Abbeel的演讲，对VR和AI在机器人控制方面的应用进行了简单梳理，发现AI和VR等在机器人控制等方面还是有实在的应用，只不过离取得实质性突破，还有相当长的距离。

机器人控制的几种类型

很多机器人的研究目标很多是模拟人的智能，所以研究人的控制系统，对于机器人有很大的借鉴意义。人体的神经系统由大脑、小脑、脑干、脊髓、神经元等共同构成，复杂而又完善。人体神经系统包括中枢神经系统和周围神经系统。中枢神经系统由脑和脊髓组成，是人体神经系统的最主体部分。周围神经系统是从脑和脊髓发出的分布到全身各处的神经。无数的神经元存在于神经系统各处，构成神经网络。

中枢神经网络负责运动控制，主要分成三层：

大脑：居于最高层，负责运动的总体策划，各种任务的下达。

小脑：居于中间层，负责运动的协调组织和实施。人体平衡由小脑控制。

脑干和脊髓：属于最低层，负责运动的执行，具体控制肌肉的骨骼的运动，由脑干和脊髓完成。

三层对运动的调控作用不同，由高到低，低层接收高层的下行控制指令并具体实现。大脑可直接也可间接的通过脑干控制脊髓运动神经。

如果把机器人与人进行类比，机械臂控制器就类似于人的脊髓，负责控制电机（肌肉）和机械机构（骨骼）的具体运动，多足机器人的运动控制器，就类似于人的小脑，负责控制平衡和协调。而机器人的操作系统层，则类似于人的大脑，感知和认知世界，并下达各种复杂的运动目标。

基于以上类比，参照目前的各类机器人的情况，机器人的运动控制大概可以分成4种任务：

脊髓控制——机械臂运动的基础控制。工业机器人，各类机械臂，无人机的底层运动控制等面临的主要是这类问题。

小脑控制——多足机器人的平衡和运动协调控制。这块目前是机器人控制仍未突破的难点，目前做的最好的显然是波士顿动力。

大脑控制——环境的感知。主要是扫地机器人、无人机等底层运动控制已经封装好的机器人的导航和路径规划。需要通过环境感知，对自身和目标进行定位、导航和运动规划。

大脑控制——环境的认知和交互，也就是机器人具体执行交互任务，如控制机械臂抓取物体，执行操作等。这是服务机器人需要突破的重要问题。

几种具体控制的AI应用情况

1.脊髓控制类

脊髓控制的两种典型的应用是机械臂路径规划和无人机的飞行控制。这类问题属于传统自动控制理论，以数学和动力学建模为基础，发展了很多年，已经有了非常完备的理论和实践基础，也取得了很好的效果。虽然深度学习在最近很热，理论上也可以用于这类控制。但目前在这类基础控制领域，并没有应用。主要原因可能有：

1）工业机器人高精度重复特定动作等，基于自动控制理论已经能从数学上很好的解决，且由于了解原理，属于白盒系统。既然有可靠的白盒方案，没必要换成黑盒的神经网络控制系统。

2）工业机器人等应用领域，对控制算法稳定性要求很高。而作为黑盒方案的神经网络控制系统，数据上还无法证明其稳定性。神经网络控制器一旦发生问题，难以进行解释和改进。

3）神经网络算法基于大量数据训练，而现有的运动控制中，比如飞控，拿到实际实验数据的成本高，大量数据的获取非常困难。

2.小脑控制类

小脑控制典型问题是类人型双足和多足机器人的平衡和运动协调控制问题。这方面一直是基于传统控制理论在进行研究，不过由于相比于机械臂或无人机，其运动的自由度高很多，难度很大。双足类人机器人给人大多数的印象还是运动迟缓、僵硬、站不稳。波士顿动力的Altas、大狗等已经是在这方面最先进的，波士顿动力学公司并未公布他们使用的技术，但谷歌工程师Eric Jang表示，根据从演讲得来的信息，BD的机器人控制策略使用基于模型的控制器，并不涉及神经网络相关算法。

3.环境感知类

主要的场景是服务机器人的路径规划、无人机目标追踪、工业机器人的视觉定位等，通过感知环境，给封装好的运动控制系统下达目标运动指令。

目标识别

环境感知过程中的目标识别，如无人机目标的识别和追踪等，有神经网络的帮助，可以识别的更准确，已经在大疆等无人机上应用。

定位导航和路径规划

目前机器人的定位导航，主要基于流行的vSLAM或激光雷达SLAM技术。主流的激光雷达方案大概可以分三步，中间部分环节可能涉及到一些深度学习，大部分内容并不涉及深度学习相关。

第一步：SLAM，构建场景地图，用激光雷达构建场景的2D或3D点云，或者重建出3D场景。

第二步：构建语义地图，可能会对物体进行识别和分割，对场景中的物体进行标记。（有的可能略过这一步）

第三部：基于算法进行路径规划，并驱动机器人的运动。

4.环境交互

典型应用场景：机械臂抓取目标物体等。与环境的交互，一直是传统自动控制难以解决的问题。近年来，以强化学习为基础，AI相关技术用在了这类问题上，取得了一定的研究进展，但是否是未来的主流方向，仍存在很大争议。

1）强化学习

强化学习框架中，有一个包含神经网络的Agent负责决策。Agent以当前机器人传感器所采集到的环境为输入，输出控制机器人的行动命令action，机器人行动后，再观察新的环境状态和行动带来的结果Reward，决定下一步新的行动action。Reward根据控制目标进行设置，并有正反向之分。例如，如果以自动驾驶为目标，正向的Reward的就是到达目的地，反向就是不能达到目的地，更不好的Reward就是出车祸。然后重复这个过程，目标是最大化Reward。

强化学习的控制过程，本来就是个正向反馈的控制过程，是AI用于机器人控制的基础。以此为基础，强化学习在机器人控制方面出现了一些研究成果。

2）环境中寻找目标

16年，李飞飞组放出了一篇论文，基于深度强化学习，在以目标图像为输入的情况下，不建图去找东西。大致思路是：根据机器看到的图，决定怎么走，然后再看图，再决定新走的一步，直到找到东西。论文将目标图像作为输入，训练出来的神经网络具有通用性。

这种方式找东西更接近人的思维。训练出的控制器并没有记住物体的位置，更不知道房屋的结构。但它记住了在每一个位置，通向各个物体应该怎么走。

3）机器人抓取

传统的机器人学研究认为，需要非常清楚要抓取的物体的三维几何形状，分析受力位置和力的大小，再反向计算机器手如何一步步移动到这些位置。但这种方式抓取不规则形状和柔性物体会很困难。例如毛巾，可能需要看成一系列刚体的链接，再进行动力学建模分析，但是计算量比较大。而小黄鸭那样的橡胶，外部并不能看出弹性程度，难以计算出需要施加的正确的力。

Pieter Abbeel、DeepMind和OpenAI关于机器人控制的研究，都以此深度强化学习为基础。基于强化学习进行机器人抓取，以机器视角看到的图像为输入，以机器最终抓到物体为目标，不断对机器进行训练，从而在不建模和不做受力分析的情况下，实现对物体的抓取。Pieter Abbeel已经展示过机器人叠毛巾，开瓶盖，装玩具等复杂的动作。

不过基于强化学习也仍有很多问题，如效率低、推理过程长、任务难以描述、不能终身学习、不能最大限度从真实世界获取信息等。其中一些通过meta学习，one-shot学习，迁移学习，VR示教等方法的引入得到了改善，有些则还暂时难以解决。

5.Dexterity Network

鉴于深度强化学习的各种问题，Pieter Abbeel在UCBerkeley的同事Ken Goldberg，则采用了叫做Dexterity Network（Dex-Net）的研究思路。首先通过传统机器人学中分析受力和建模的思路，建立一个包含大量数据的数据集，这个数据集里的每一项数据包含一个物体的模型和这个物体在不同姿态下可以被稳定抓起来的施力方式，这些施力方式是通过物体模型计算出来的。有了数据之后，用这些数据训练一个神经网络。然后给出一个新物体，通过神经网络判断这个物体和数据集里哪个物体最相似，然后根据最相似的物体的数据集里包含的施力方式计算出这个新物体的最稳定施力方式。

Ken Goldberg的方案的一个重要弊端，是计算量过于庞大。整个算法占用了Google云服务器上的1500台虚拟机的计算量。此方法也让“云机器人”这个概念受到了关注。

目前Pieter Abbeel和Ken Goldberg的两种方法还处于学术争议阶段，新的研究成果还在不断出现，也还有很多问题没有解决，尤其是稳定性和鲁棒性是各方争议的焦点。不同于语音识别音箱出了错，无非是闹个笑话，机器人系统对稳定性和可靠性的要求非常高，系统一旦出错，轻则毁物，重则造成人类的生命危险。Pieter Abbeel也承认目前还没考虑鲁棒性和稳定性问题，似乎整体还没达到商用产品级。

总结

总体而言，以强化学习为代表，AI在机器人控制领域近两年取得了一些进展，尤其是在过去研究方法难以突破的环境交互问题方面取得了进展。但基于神经网络的控制系统，在鲁棒性等方面短期似乎难以得到解决，因此离实际应用还有很远的距离。在多种研究方法的共同努力下，我们也期待机器人控制问题能够早日有所突破。

上一篇:欢迎公民AI 创造更易懂、负责任的人工智能

下一篇:当人工智能遇见传统中医

推荐阅读

2018年05月31日 | 使用IAR编译STM8S 如何生产烧录文件

IAR编译后可以生成的烧录文件格式有4中,如下第一种是Motorola,其生成文件和STVD生成烧录文件.s19格式一样的，即可以通用第二种是16进制，keil等等常都用到的；第三种是二进制的，个人比较少用第四种是？？我也没有用过。IAR中格式选择：按图指示：I至此，重新编译，即可生成想要的烧录文件及其格式。

2019年05月31日 | 技术文章—关于EMC和EMI测试的经验之谈

一次小失误导致板子重新制作了两次，而由于EMC测试经验不足导致问题迟迟得不到解决。吃一堑，长一智，仿佛在电路设计的过程中就这样不断的用资金的投入来解决经验上的不足。第一次：环形地线为了是电路板的地网络和供电系统的地网络隔离开来，在PCB设计铺铜时画了一个和外围电路相接的地回路，而对内部的地采用了共模电感和差模电感来连接。一直以为是...

2020年05月31日 | 临场机器人可远程操控太空探索任务

在科幻电影中，机器人帮助太空人工作将变成现实。日本机器人新创公司Gitai正研发一项新技术，未来可将远程临场(lepresence)仿真机器人送至太空，代替太空人处理艰难任务，先前该公司与日本宇宙航空研究开发机构(JAXA)合作，对机器人的实用性进行研究。据报导，送太空人执行任务既危险又昂贵，若能遥控半自动机器人代替这项工作，宇宙航空机构预估将节...

2021年05月31日 | 消息称AMD向台积电预订未来两年5nm及3nm产能

史海拾趣

Delus Corp公司的发展小趣事

Delus Corp公司非常重视人才培养和团队建设。公司积极引进高素质人才，并为员工提供良好的培训和发展机会。公司建立了完善的激励机制和绩效考核体系，激发员工的工作积极性和创造力。同时，公司还注重团队建设和文化建设，营造了一个积极向上、团结协作的工作氛围。这些措施的实施，使得公司拥有一支高素质、专业化的团队，为公司的发展提供了有力的人才保障。

Global Mixed-Mode Technology Inc公司的发展小趣事

三相缺相报警灯电路的维护周期和注意事项应根据实际情况来制定。一般来说，建议定期检查电路的连接情况、继电器的动作情况以及报警灯的工作状态等。同时，还需要注意保持电路的清洁和干燥以防止短路或腐蚀等问题的发生。在维护过程中应严格遵守操作规程和安全规范以确保人员和设备的安全。

光磊(GL)公司的发展小趣事

设计和实现一个简单的三相缺相报警灯电路，可以使用三个中间继电器分别接在三相电的L1、L2、L3相上，继电器的另一端接零线。继电器的常开触点与报警灯（如黄灯、绿灯、红灯）串联，形成指示灯电路。当三相电正常时，继电器均吸合，常开触点断开，报警灯不亮。当某一相缺相时，对应相的继电器失电，常开触点闭合，使对应的报警灯亮起。同时，可以加入声音警报电路，当任一相缺相时，触发声音警报。

Alpha & Omega Semiconductor(万国半导体)公司的发展小趣事

三相缺相报警灯电路在需要稳定三相电源供电的场合下非常重要。例如，在工业生产中，三相电动机、变压器等设备对电源的稳定性要求很高，一旦发生缺相，可能会导致设备损坏或生产事故。因此，在这些场合下需要安装三相缺相报警灯电路来及时监测并报警缺相情况。

CTC [Compact Technology Corp.]公司的发展小趣事

CTC公司在创立初期便致力于半导体技术的研发。一次偶然的实验中，公司团队成功研发出了一种新型的晶体管结构，这一创新使得晶体管的工作效率大大提升，同时降低了能耗。这一技术突破迅速引起了行业的关注，CTC公司的名字开始在电子行业中崭露头角。随着该技术的普及和应用，CTC公司的业务逐渐扩大，奠定了在电子行业的重要地位。

Fronter Electronics Co Ltd公司的发展小趣事

Fronter电子成立于1991年，由一群对电子技术充满热情的创业者共同创立。在公司成立初期，Fronter电子专注于电子元件的代理与销售，通过引进国际知名品牌的产品，如SUNLORD、KDS等，迅速在行业内建立了初步的声誉。公司凭借敏锐的市场洞察力和高效的供应链管理，逐步在电子元器件市场中站稳脚跟。

问答坊 | AI 解惑

读手机电路图一些基本方法

不少学员和同行反映，一部故障手机该换的元件都换了，但就是修不好机，大多数情况是对手机电路掌握不透彻，不会读和分析手机电路图，\"一吹二洗三代换\"，三板斧下去，固然能解决一些问题，但深入下去就束手无策了。很多人看到电路图就头痛， ...…

查看全部问答＞

（转贴）网络化监控存储之前端存储

所谓前端存储，是在网络视频监控系统的前端设备(如网络视频编码器或网络摄像机)中内置存储部件，由前端设备直接完成监控图像的本地录制和保存。前端存储具有几个方面的优势：一是可以通过分布式的存储部署，来减轻集中存储带来的容量 ...…

查看全部问答＞

示波器触发功能详解

触发是数字示波器区别于模拟示波器的最大特征之一。触发是发现问题之后定位问题的最重要手段。数字示波器的触发功能非常丰富，善于使用触发能轻松定位出您想寻找到的异常信号或感兴趣的信号。很多工程师习惯于“Auto Setup”之后看到屏幕上出现波 ...…

查看全部问答＞

EVC下怎样调用GetUserDefaultLangID()?

链接失败，愁死了…

查看全部问答＞

【求助】程序调试不通，怎么回事啊？

/*目的是按下按键则蜂鸣器就发出声音，电路板是msp430F169的学习板*/ #include <msp430x16x.h> #define NO_KEY 0 //没有按键 #define KEY_K1 1 //按键1 #define KEY_K2 2 //按键2 #define KEY_K3 3 //按键3 #define STEP_IDEL 0 ...…

查看全部问答＞

430的ＲＣ复位电路如此不稳定？？

做了一批板子，有10%左右上电不能复位，用的是一般的ＲＣ电路，应该不是ＲＣ质量问题，板子已经做好了，不可能加器件了，目前用的是100K+104电容，我目前如何才能挽救？ＣＰＵ是F123…

查看全部问答＞

IO口中断问题

用P1.3按键进入中断，点亮LED1即P1.0 为什么我加了LPM3就进不了中断了？改成LPM0进不了中断咋回事? 解，LMP0和LPM1等几种模式如何选择？ void main(void) { WDTCTL = WDTPW + WDTHOLD; P1DIR = BIT0 + BIT6; P1DIR &= ~BIT3; P1REN |= ...…

查看全部问答＞

【STM32F3 Discovery学习笔记1】

【STM32F3 Discovery学习笔记2】上周拿到stm32f3的discovery马上进行学习了。stm32f3是ST公司最新的一款cortex-M4的芯片，所以市面很少有此芯片他的开发板，只好用discovery了，这块开发板价格也很便宜，很适合学习使用。不过购买前一定要注 ...…

查看全部问答＞

2003~2013元器件清单对比

本帖最后由 paulhyde 于 2014-9-15 03:37 编辑 RT 2003~2013元器件清单对比 …

查看全部问答＞

能直观且从电路的实际原理出发谈谈AD的转换原理吗？

谁能直观且从电路的实际原理出发谈谈AD的转换原理？ …

查看全部问答＞