历史上的今天
返回首页

历史上的今天

今天是:2025年04月03日(星期四)

正在发生

2020年04月03日 | 关于机器人智能抓取AI+Grasp的技术分析

2020-04-03 来源:激光天地

(文章来源:天地)

抓取规划问题是指确定物体与手指间的一系列接触位置,使得手指能抵抗任意外力且灵活操作物体的能力。传统的基于分析的抓取规划需要根据已知的被抓物体模型根据力闭合的条件判断抓取的好,这种方法只适合对已知的物体进行抓取。然而日常生活中有很多相似物体,没有必要为每一个物体都建立精确的模型,因此可以用相似性匹配的方法解决这类物体的抓取。随着人工智能的发展,人工神经网络可以从大量的已知物体的抓取中提取出有用的抓取基元,从而实现对未知物体的抓取。这样做的好处是不必为每个被抓物体建立几何模型,让机器人智能抓取操作物体。

美国加州大学伯克利分校提出了利用大量的物体三维模型和分析的方法生成抓取数据集,并利用深度图和卷积(CNN)对抓取进行分类 [2]。他们首先把抓取简化为一个从上至下的夹取(top-down grasp),根据输入的点云生成上百个成对的抓取候选,再利用CNN对候选抓取进行快速评分,从而得到最好的抓取。与之前的基于数据的抓取不同的是,他们没有使用费时费力的人工标定抓取的方式或机器人随机抓取来采集数据集,而是利用力闭合的原理通过分析的方式计算出抓取的好坏(是否力闭合)。这样的好处是可以低成本的生成大量的数据集。

美国西北大学进一步使用点云在不同方向的投影作为人工神经网络的输入对抓取进行评分并把抓取数据集扩展到6D位姿抓取。利用点云的好处是可以让网络得到更丰富的信息。不同于Dex-Net,这个工作使用的是6D抓取位姿作为抓取的表示。在生成抓取候选上,该文使用了一些设计好的策略。这个策略基于物体的曲面形状。首先随机在物体表面采样一点,以这个点所在的曲面法向作为抓取候选的朝向,“主成分”方向作为两个夹爪连线的方向。并通过基于该抓取的旋转和平移扩充抓取候选的个数。通过这种采样方式,可以增加抓取候选中好抓取的比例。经过CNN对抓取候选的分类后,最高可达93%抓取成功率。

进一步,德国汉堡大学张建伟教授团队和清华大学孙富春教授团队共同提出了对上述工作的改进[4]。对于数据集的生成,通过在给抓取打分时不断调整夹爪和物体之间的摩擦系数得到一个更细化的抓取分数(摩擦系数越小,抓取分数越高)。这样的数据集可以得到一个带分数的抓取,从而可以让网络学得更细分的抓取分类。对于网络结构上,他们使用了PointNet,这样的好处是可以直接使用点云作为输入,不需要对点云进行投影。更大的保留了点云的几何信息。

不同于首先生成抓取候选,再对抓取分类、评分的思路,公司的机器人研究团队提出了直接根据输入的物体点云生成抓取。在数据集生成上,他们使用了纯物理引擎仿真抓取的方式。这种方法的好处是可以生成用特定规则生成抓取[3.4]得不到的抓取。这是因为通常分析的方法生成抓取数据集把抓取简化成了两个点。

而在实际抓取中,机器人通常具有两个平行的手指作为夹爪。另一个原因是抓圆环物体如带柄的马克杯时,力闭合原理无法生成“Caging”的抓取。因此用物理引擎可以完全模拟真实中的抓取情形,生成更多样化的抓取。在网络上,他们把被抓物体点云和夹爪点云一起作为输入,使用PointNet++网络和自编码机的结构生成好的抓取,并利用一个网络优化生成的抓取。

基于多模态的抓取通常是指通过不同的指尖在正式抓取前通过“预抓取”判断抓取的稳定性,从而决定是继续抓取还是调整一个新的抓取姿态。清华大学孙富春教授团队提出使用视觉来生成抓取,并用指尖的触觉判断抓取的稳定性[6]。为此,他们采集了一个视觉、触觉抓取数据集,并分别用两个网络对抓取进行生成和稳定性判断。该团队又与中国研究院合作,建立了一个视觉、触觉、力等多模态的机器人抓取数据集,通过视触融合实现抓取稳定判断[7]。清华大学孙富春教授团队也是利用多模态信息实现的机器人智能抓取,而赢得了“IROS2019机器人灵巧抓取操作比赛”物流分拣项目的冠军。

加州大学伯克利分校提出了利用一个基于视觉的触觉—GelSight来进行多模态抓取任务[8]。得益于他们使用的基于视觉的触觉传感器,可以天然的使用广泛应用的视觉处理神经网络(CNN),通过与抓取,机器人判断抓取的好坏并生成下一步的动作。这样这个机器人系统可以自主的根据触觉反馈调整抓取策略而不需要人工干预。

二指抓取的好处是对抓取的表达比较简单,但是抓取通常并不是机器人操作的最终目的,人们往往希望通过手内改变被抓物体的姿态和位置完成一些操作任务。如使用。 美国马里兰大学的研究者提出了一个端到端的多指抓取生成网络[9]。 这个网络使用点云作为输入,使用3DCNN网络直接生成Shadow多指手的抓取规划。

美国麻省理工学院的学者针对多指抓取生成过程中网络不能适应不同的多指手的问题提出了解决方案[10]。他们提了一个统一的多指抓取模型以适应不同的机械手。首先,他们把爪子和被抓物体的特征映射到一个低维空间。然后用一个点云选择网络去生成接触点,通过接触点继而生成一个无障碍的抓取。

上面的工作都是与任务无关的无序抓取,但是在机器人操作上抓取通常是有目的的。如转移物体,递给其他机器人/人,使用抓取的物体。在这一领域的工作是西安交通大学的机器人课题组[11]。他们在一个有重叠的场景下完成了基于任务的抓取。首先,他们建立了一个的堆叠物体的数据集,并使用条件随机场(C)建立了物体的语义模型。这个模型可以的推导过程用RNN来表示,这样整个基于任务的模型可以端到端进行训练。

机器人的智能抓取已经成为研究热点,也逐渐在物流快件、工件、食品等分拣行业中凸显了重要性。未来如何实现机器人认知的智能抓取操作将会成为重点研究问题。
      (责任编辑:fqj)

推荐阅读

史海拾趣

ELDECO公司的发展小趣事

面对全球电子记录仪市场的快速增长,ELDECO公司制定了国际化发展战略。公司首先在欧洲市场设立了研发中心和生产基地,通过与当地合作伙伴的紧密合作,成功将产品打入欧洲市场。随后,公司又在美国、亚洲等地设立了分支机构,进一步拓展全球市场。通过国际化战略布局,ELDECO公司不仅提高了品牌影响力,还获得了更多的市场机会和客户资源。

Goldentech Discrete Semiconductor Inc公司的发展小趣事

在20世纪90年代末,Goldentech Discrete Semiconductor Inc.(以下简称“Goldentech”)由一群来自顶尖学术机构的半导体专家创立。公司从成立之初就专注于研发高性能的离散半导体器件,特别是针对当时迅速发展的移动通信市场。Goldentech的创新团队成功开发出了一种新型的低功耗、高频率的晶体管,这一技术突破迅速吸引了多家手机制造商的注意。凭借这一技术优势,Goldentech在短时间内成为移动通信领域离散半导体器件的主要供应商之一,推动了公司业务的快速增长。

迈翔科技(COILMX)公司的发展小趣事

迈翔科技(COILMX)的创始人看到了电子行业,特别是电感器市场的巨大潜力。1996年,公司正式成立,初期主要专注于SMD电感的设计、制造和销售。公司从香港起步,逐步在深圳设立工厂,引进先进的生产设备和技术,为未来的发展奠定了坚实的基础。

德力康(DLK)公司的发展小趣事

在扩大产品线的同时,DLK公司也积极拓展国内外市场。通过参加各种行业展会、建立营销网络、加强客户服务等方式,DLK公司成功将产品销往全球多个国家和地区。在品牌建设方面,DLK公司注重产品质量和服务质量的提升,积极塑造企业形象和品牌形象。通过多年的努力,DLK已经成为了国内外知名的连接器品牌之一。

General Magnetics Inc公司的发展小趣事
由于环境因素(如潮湿、污染)或内部过电压等原因,可能导致绝缘层破裂或老化。
Amveco Toroidal Power Products公司的发展小趣事

Amveco Toroidal Power Products公司成立于XXXX年,初始阶段主要专注于环形变压器的研发与生产。创始人凭借对环形变压器技术的深入了解和市场需求的敏锐洞察,带领团队克服了初创期的种种困难,成功开发出了具有高效能、低噪音特点的环形变压器产品,并赢得了客户的初步认可。随着市场口碑的逐渐积累,公司的业务规模开始稳步扩大。

问答坊 | AI 解惑

德生R9700型高灵敏度收音机电源原理图

原文地址http://www.e2prom.cn/Article_View.asp?id=158…

查看全部问答>

发布我的小作品--U盘

发布我的小作品--U盘(实际是SD卡读卡器) ATmega168+PDIUSBD12+SD (内含GCC源码和原理图) 年前里曾在44b0x板子上实现移动硬盘的功能,年后利用在阿莫这买的一片TQFP封装的m168 和一年前在上海赛格买的D12,再加上花15大洋的SD读卡器上的SD插槽。 ...…

查看全部问答>

网友在各自领域中所用到的芯片总结1(转载)

网友在各自领域中所用到的芯片总结(转载)1.音频pcm编码DA转换芯片cirrus logic的cs4344,cs4334   4334是老封装,据说已经停产,4344封装比较小,非常好用。还有菲利谱的。   8211等。 2.音频放大芯片4558,833,此二芯 ...…

查看全部问答>

关于开关管对于EMI的影响

我是个初学者,求教高人,都说开关管冲放电斜率越大(即冲放电越快)产生EMI的尖峰越突出,这到底是为什么呢?能不能推荐一些文章或是参考资料?小弟我这几日寝食难安,网上也啥资料找不到,国外的相关文章也很少有讲,真是急死了,在此拜谢!!…

查看全部问答>

GCCAVR下的12864初始化,下载后12864无反应,请各位大侠帮忙指点

#include #include #define Enable_0()  (PORTC&=~_BV(PC2))       #define Enable_1() (PORTC|=_BV(PC2))      #define RW_0()     (PORTC&=~_BV(PC1)) #define RW ...…

查看全部问答>

wince显示驱动Rotate问题

在wince下面有一个RotateScreen.exe 系统默认的是横屏,横屏状态下,一切OK。 但是切换到竖屏之后,一般的应用程序也是OK的,但是,像视频播放和一些与Overlay相关的DDraw程序就会运行错误 甚至直接花屏,这个是什么原因啊,这个Rotate在显示驱 ...…

查看全部问答>

U盘变光驱

请教各位大大 如何将U盘变光驱? 其原理是什么?能不能帮我讲解讲解,或者推荐一些链接,谢谢了 呵呵,我希望不要告诉我哪些工具可以实现,这些我知道。 我想知道的是其实现原理是什么…

查看全部问答>

C8051F340使用仿真器的时候出现的问题。

最近在调试一块C8051F340为MCU的板子。能够正常工作,并且USB接口也能使用。但是在对XRAM进行操作的时候总是有问题,请教各位uchar xdata *M;M=0xB00;*M=0x01;我使用仿真器单步运行的时候,在memory窗口中看不到0xB00的处的数值变化,这个值总是保 ...…

查看全部问答>

每日几问?

在看夏老师的书的同时,看到课后有许多的思考题,由于没有给出标准答案,所以有些很好的问题我觉得是需要思考的,所以希望大家集思广益,发表自己的想法,能积极参与回答讨论,最后大家把问题搞明了。今天第一问,比较简单: 1、仿真是什么?仿真 ...…

查看全部问答>

求高手指点,avr单片机红外解码问题,我的程序怎么解不出。

#include #include #define uint unsigned int #define uchar unsigned char uchar table[4]; uint time; uchar dw=16; void delay1(void) {     uint i;         for(i=0;i…

查看全部问答>