历史上的今天
返回首页

历史上的今天

今天是:2025年03月29日(星期六)

2020年03月29日 | 微软研究人员实现了让机器人拥有像人一样的判断能力

2020-03-29 来源:DeepTech深科技

无论是在拥挤的人行道上行走,还是在社区足球联赛中射门进球,人类都会下意识地利用感知—动作循环(percepTIon-acTIon loop)做几乎所有的事情。感知—动作循环可以使我们在一个连续的实时循环中使用感官输入做出正确的动作,其也是 “自治系统” 的核心。

但当前一代的机器人等 “自治系统” 在直接根据视觉数据做出正确决策方面仍远远不及人类,其依然受到难以收集大量真实世界数据的限制。此外,虽然我们能轻易生成大量模拟数据,但这类数据在现实生活的各种场景中,通常不能催生安全的行为。

如何让机器人具有如人类一般的 “自治” 能力?一项来自微软研究人员的研究,让我们看到了巨大的可能性。

研究人员向我们描述了这样一种系统:它可以帮助机器人直接从相机图像中推理出正确的动作。以为例,无人机可以通过模拟学习完成特定路线的导航。

通过模拟训练,机器人可以学会独立观察现实世界中的环境和条件(包括看不见的情况),然后作出正确决策,这使得机器人非常适合用于搜索和救援任务。研究人员认为,在不久的将来,这种机器学习系统可以帮助机器人更快地识别出需要帮助的人。

受人类大脑的启发,该系统将视觉信息直接映射到正确的控制动作上,也就是说,将视频帧的高维序列转换为代表真实世界状态的低维形态。根据研究人员的说法,这种方法使模型更容易解释和调试。

图 | 系统框架通过模拟学习使用多个数据模态的低维状态表征

研究人员在微软官网上的一篇博客文章中写道:“我们希望可以借助这个系统使得当前技术更加接近人类应对环境提示、适应困难条件和自主操作的能力。我们有兴趣去探索要建立一个达到人类水平的自主系统需要做些什么。”

无人机实验

在机器学习系统框架内,研究人员将感知组件(即理解所看到的东西)与控制策略(根据看到的东西决定做什么)分开。“通过将 ‘感知—行动循环’ 分为两个模块,并将多种数据模式纳入感知训练阶段,我们可以避免网络过度拟合传入数据的非相关特征。比如,尽管用于模拟和物理实验中的门的大小相同,但它们的宽度、颜色,甚至内在的相机参数却不一样。” 一位研究人员说。

该团队将机器学习框架应用在一个带有前置摄像头的小型四轴飞行器上,在只使用来自相机的图像的情况下,试图通过为无人机传授一种 策略,从而使其完成特定路线的导航。

研究人员使用一个名为 Aiim 的高保真模拟器在模拟环境下训练 AI,然后将其部署到现实世界的无人机上。其中,一个关键挑战是模型必须对模拟和现实世界之间的差异(如光照、纹理)具有鲁棒性(指控制系统在一定结构 / 大小的参数摄动下维持其它某些性能的特性)。为此,研究人员使用了一个名为跨模态变量自动(CM-VAE)的框架,来生成紧密弥合模拟与现实差距的表征,从而避免对无关数据的过度拟合。

在无人机实验中,一种数据模态考虑了原始无标签输入(FPV 图像),而另一种数据模态描述了与当前任务直接相关的状态信息,后者对应于无人机坐标框架中定义的下一个门的相对姿势。研究人员通过扩展 CM-VAE 框架,得到了一种低维的潜在环境表征。该框架为每个数据模态使用一个编码器 - 解码器对(encoder-decoder pair),同时压缩与单个潜在空间之间的所有输入和输出(图 b)。该系统将有和无标记的数据模式自然地纳入潜在变量的训练过程,然后使用模仿学习训练一种深度控制策略,将潜在变量映射到无人机的速度命令中(图 a)。

图 | a. 控制系统架构。来自无人机的视频的输入图像被编码到一种潜在的环境表征中。一个控制策略作用于低维嵌入,以输出所需的机器人控制命令。b. 跨模态 VAE 架构。每个数据样本被编码成单独的潜在空间中,这个潜在空间可以被解码成图像,或者转换成另一种数据模态,比如门相对于无人机的姿态。

该系统的感知模块将输入图像压缩到上述的低维表示中,从 27,648 个变量下降到可以描述它的最基本的 10 个变量。解码后的图像提供了无人机可以看到的前方情况的描述,包括所有可能的门的大小和位置,以及其它不同的背景信息。

图 | 由跨模态表示生成的虚化图像的可视化,解码后的图像直接捕捉到门对应的背景信息

研究人员在 45 米长的带有门的 S 形轨道和 40 米长的带有不同门的圆形轨道上,分别了这个系统的能力。他们表示,使用 CM-VAE 的效果明显优于直接编码下一位置的端到端 AI 策略,即使背景存在 “强烈” 的视觉干扰,无人机还是通过使用跨模态感知模块成功完成了任务。

图 | 45 米长的 S 形轨道和 40 米长的圆形轨道

研究人员表示,这些结果显示了该系统在现实世界应用的 “巨大潜力”。比如,尽管存在年龄、体型、性别和种族差异,该系统可能帮助自主搜索和救援机器人更好地识别人类,从而让机器人有更好的机会识别和找回需要帮助的人。

不完美的实验

尽管无人机的实验结果着实令人兴奋。但研究人员表示,他们在实验中遇到了一个意想不到的结果,即将未标记的真实世界数据与标记的模拟数据结合起来训练表征模型,并没有提高整体性能,只使用模拟数据效果更好。

对此,他们认为,未来工作的一个有趣的方向是使用对抗性技术来降低由模拟和真实图像编码的相似场景之间的潜在空间距离,这将降低训练和测试阶段数据分布的差异。此外,研究人员设想扩展使用无标签数据进行策略学习的方法。比如,除了图像之外,是否可以结合不同的数据模式(、甚至声音)来学习如何对环境进行表征。

尽管还存在一些问题,但无人机实验的成功证明了这种方法具有应用于其他真实机器人任务的巨大潜力,其他机器人同样需要类似的能力来实现实时解释输入,并在确保安全操作的同时做出正确决策。
责任编辑;zl

推荐阅读

史海拾趣

ABC [ABC Taiwan Electronics Corp]公司的发展小趣事

近年来,随着环保意识的日益增强,ABC Taiwan Electronics Corp积极响应绿色生产的号召。公司引入了环保材料和节能技术,降低了生产过程中的能耗和排放。同时,公司还加强了废弃物的处理和回收利用,实现了资源的循环利用。此外,ABC还积极参与社会公益活动,支持教育事业和环保事业,履行了企业的社会责任。

这五个故事展示了ABC Taiwan Electronics Corp从创业初期的艰难起步到逐步成长为国际知名电子零件供应商的发展历程。通过技术突破、国际化战略、产业升级和绿色生产等方面的努力,ABC不断应对市场的变化和挑战,实现了稳健的发展。

GWP Group公司的发展小趣事

进入九十年代,ABC Taiwan Electronics Corp迎来了一次重要的发展机遇。公司成功研发出了一款具有创新性的电子连接器,凭借其高性能和稳定性,迅速在市场上获得了广泛认可。这一技术突破不仅为ABC带来了大量订单,也使其在电子连接器领域树立了领先地位。公司借此机会不断扩大生产规模,提升技术水平,逐渐成为了行业的佼佼者。

芯佰微(Corebai)公司的发展小趣事

随着技术的不断发展,芯佰微逐步拓展了自己的产品线,覆盖了放大器、接口电路、电源管理、时间数字转换器、DAC数模转换、ADC模数转换等多个领域。同时,公司积极开拓国内外市场,与众多知名企业建立了合作关系,将产品广泛应用于手持移动终端、消费类电子产品、个人电脑及周边设备、网络通信设备、医疗设备、办公设备等多个领域。这些努力使得芯佰微的产品在市场上获得了广泛认可。

HDP_Power公司的发展小趣事

芯佰微始终将品质管理作为公司的核心工作之一。公司建立了严格的质量管理体系,从原材料采购到产品生产、测试、包装等各个环节都进行严格的质量控制。同时,芯佰微也非常注重客户服务,始终将客户的需求放在首位,及时解决客户在使用过程中遇到的问题。这些措施使得芯佰微赢得了客户的广泛信任和好评。

Digital公司的发展小趣事

随着业务的不断发展和市场的不断扩大,DIALIGHT公司逐渐实现了全球化布局。他们在美国、英国、丹麦、德国、马来西亚、新加坡、澳大利亚、墨西哥和巴西等地设立了分支机构或办事处,为全球客户提供及时、高效的服务。此外,DIALIGHT还积极寻求与其他企业的合作与共赢,通过战略合作协议的签署,为双方带来新的业务机遇和合作空间。这些举措不仅增强了DIALIGHT的市场竞争力,也为其未来的发展奠定了坚实的基础。

请注意,由于篇幅限制,以上三个故事仅为DIALIGHT公司发展历程的简要概述。如需更详细的信息和更多故事,建议查阅相关资料或访问公司官网。

Delkin Devices公司的发展小趣事

为了更好地服务全球客户,Delkin Devices积极拓展海外市场。公司在欧洲设立了办事处,以便更直接地接触欧洲市场并了解当地客户需求。此外,Delkin Devices还通过参加国际展会、建立合作伙伴关系等方式,不断拓展其在全球范围内的影响力。通过这些努力,Delkin Devices成功将产品销往全球多个国家和地区,实现了国际化布局和市场拓展。

问答坊 | AI 解惑

ARM2210的智能移动机器人人机界面设计

摘要: 移动机器人人机界面为移动机器人的运动控制提供直观的路径图形、运动速度和角度、障碍物信息等。通过ARM2210的串口UART0接收中心处理器PC104的运动信息,利用东芝公司的液晶控制器T6963C驱动STN液晶屏YL240128A,以及ZLG/GUI软件包提供的基 ...…

查看全部问答>

SJA1000的中英文对照应用指南

中英文对照SJA1000的应用指南,经常用到CAN的朋友可以看下,希望有帮助…

查看全部问答>

坛友们是否都还在祭祖氛围中,还没找回上班的状态

上班都半天多了,坛友还没来坛的报道,看来你们还处在祭先人的氛围中。或悲伤或萧杀…

查看全部问答>

EMC测试和其他测试项目

EMC 测试       随着电子产品越来越多地采用低功耗、高速度、高集成度的 LSI 电路,使得这些系统比以往任何时候更容易受到电磁干扰的威胁。而与此同时,大功率设备及移动通讯和无线寻呼的广泛应用等,又大大增加了电磁骚扰的 ...…

查看全部问答>

LPC2114 I/O配置问题

我现在在做一个东西,大概的框架是这样的,首先将模拟信号通过两路AD转换之后,通过一定的算法输出,由于LPC2114没有DA转换,所以这里我使用了LPC2114里面的PWM,通过PWMDAC代替DA转换输出模拟值控制执行器。现在目前的问题是,我采用了四个PWM输出 ...…

查看全部问答>

CDMA 1X连接的域名解析

GSM模块(华为的900c)有个AT指令,AT%DNSR可以把域名解析成IP地址。但是在CDMA(EM200)模块上面,却没有找到相类似的命令。CDMA是否有支持域名解析的命令呢?或者是要自己构建数据包发送到域名服务器解析?…

查看全部问答>

单片机放电问题

做产品的时候发现一个问题,关电源后短时间内重启,发现有残留电荷影响,有什么方法可以放电??…

查看全部问答>

MC55发送AT指令没有回应,请高手指点

我用的是西门子MC55模块,用笔记本,通过USB转RS232连接到模块上,MC55的外围电路是我自己搭的。开机后,VDD显示是2.88V,CCVCC上电正常,开机不久后,接SYNC的发光二极管会闪几秒钟,之后就不闪了。 问题是,用串口调试程序发送AT指令,都任何没 ...…

查看全部问答>

应用程序不能实现触摸屏右键功能?急

触摸屏右键功能和鼠标右键有什么区别么?我在桌面上或者在wince浏览器中电击触摸屏都可以弹出右键功能的,我自己的应用程序在点击鼠标右键也能弹出菜单. 但是使用触摸屏就不能弹出右键菜单.   并且在wince下自带的图片浏览器中也一样 ...…

查看全部问答>

基于MAX4472的血压传感电路及滤波和放大电路

如下图所示,本电路采用BP01型压力传感器和运放MAX4472。BP01型压力传感器是为检测血压而专门设计的,主要用于便携式电子血压计。它采用精密厚膜陶瓷芯片和尼龙塑料封装,具有高线性、低噪声和外界应力小的特点;采用内部标定和温度补偿方式,提高 ...…

查看全部问答>