历史上的今天
返回首页

历史上的今天

今天是:2025年06月03日(星期二)

正在发生

2019年06月03日 | 人工智能领域面临极化 巨头实验室或将主宰AI未来

2019-06-03 来源:猎云网

国际象棋和围棋曾是孩子的游戏。现在AI正在赢得夺旗游戏。这些技能最终会转化到现实世界吗?

孩子们会在夏季营地开放空间玩夺旗这个游戏;同时,争夺旗子这个游戏画面也是Quake III和Overwatch等热门游戏的一部分。

无论是哪种情况,这都是一项团队运动。每一方都守卫一面旗帜,同时还要计划如何抓住对方的旗帜并将其带回到自己的大本营。赢得比赛需要良好的老式团队合作以及协调防守和攻击之间的平衡。

换句话说,夺得旗帜需要一套看起来似乎只有人工才能操作的技能。但伦敦一家人工智能实验室的研究人员表明,机器也可以攻克这项游戏,至少在虚拟世界中是可以的。

在五月三十日发表在《科学》杂志上的一篇论文中,研究人员称他们在Quake III游戏的夺旗环节中设计了自动“代理人”,这些“代理人”表现的就跟人类在操作一样。这些代理人能够自行组队来对抗人类玩家,也可以与他们并肩作战,根据情况相应地调整自己的行为。

隶属于Alphabet的DeepMind实验室的研究员Wojciech Czarnecki表示:“这些代理人可以适应具有任意技能的队友。”

通过数千小时的游戏,代理人学会了非常特殊的技能,比如在队友即将获得旗帜的情况下极速跑去攻击对手的大本营。正如人类玩家所知,当对方旗帜被夺得并带到自己的大本营时,对家的大本营中会出现一面可以抢夺的新旗。

DeepMind的项目是努力构建人工智能应用于复杂三维动画游戏的一部分,这些三维动画游戏包括Quake III、Dota 2和星际争霸II。许多研究人员认为:虚拟领域的成功最终将提升现实世界中人工智能的应用能力。

例如,这些技能可以使仓库机器人受益——当他们分组工作将货物从一个地方移动到另一个地方时,或者帮助自动驾驶汽车在交通拥堵时集中导航。位于旧金山的OpenAI实验室有着类似研究项目,项目负责人Greg Brockman说道:“游戏一直是AI的基准。如果不能攻克游戏难题,就不能指望AI解决其他问题。”

直到最近,在像Quake III这样的游戏中构建一个可以匹配人类玩家的系统才成为可能,以前看来似乎是不可能的。但是在过去的几年里,DeepMind、OpenAI以及其他实验室取得了重大进展,这要归功于一种称为“强化学习”的数学技术,这种技术使得机器能通过极端的反复试验和试错来学习。

通过一遍又一遍地玩游戏,这些自动代理人可以了解哪些策略能成功,哪些策略不成功。如果代理人在队友即将夺旗的情况下通过向对手的大本营移动而不断赢得更多积分,则会将这种策略添加到他的游戏策略中。

在2016年,同样使用这项基础技术,DeepMind研究人员构建了使得AlphaGo在东方围棋游戏中击败世界顶级玩家的系统。鉴于围棋游戏的巨大复杂性,许多专家曾认为这种突破不会这么早实现,而是起码将在未来十年内完成。

尤其是当涉及到队友之间的协调时,第一人称视频游戏的复杂程度是呈指数级的增长的。DeepMind的代理人通过大约45万轮游戏来学习如何夺得旗帜,在数周的训练中便积累了需要大约4年的游戏经验。起初,代理人惨遭失败。但通过学习突袭对手大本营时应该如何追随队友,他们逐渐了解到了这个游戏的精髓。

在完成这个项目以后,DeepMind的研究人员还设计了一个可以击败星际争霸II专业玩家的系统。在OpenAI实验室,研究人员构建了一个掌握Dota 2的系统,Dota 2这个游戏就像夺得旗帜的加强版本。今年四月,由五名代理人组成的团队击败了由五名世界上最优秀的人类玩家组成的玩家团队。

去年,人称Blitz的专业Dota 2玩家兼评论员William Lee与代理人进行过一对一比赛,当时的版本不允许团队战;在当时,William对此表示兴趣平平。但是当代理人继续学习比赛并且参加团队战时,他对代理人的技巧感到震惊。

他说:“我曾经以为机器不可能打五对五的,更不用说赢了。我绝对被征服了。”

这种技术在游戏中的应用令人印象深刻,但许多人工智能专家质疑它是否最终能转化为解决现实问题。专注于人工智能的乔治亚理工学院计算机教授Mark Riedl质疑到:DeepMind的代理人事实上并没有真正在合作。他们只是回应游戏中发生的事情,而不是像人类玩家那样互相交换信息。(甚至渺小如蚂蚁也可以通过交换化学信号进行协作。)

虽然结果看起来像是协作,但这是因为代理人作为个体本身是可以完全理解游戏中发生的事情。

负责该项目的另一位DeepMind研究员Max Jaderberg则表示:“如何定义团队合作并不是我想要解决的问题。但是一名代理人在对手的大本营坐等旗子出现这种情况,只有在依靠队友时才有可能出现。”

像这样的游戏并不像现实世界那么复杂。Riedl博士说到:“3D环境旨在使导航变得容易。Quake的战略与协调很简单。”

强化学习非常适合这类游戏。在视频游戏中,很容易识别成功的指标:获得更多的得分。但在现实世界中,没有人能保持得分。研究人员必须以其他方式定义成功。

这一点是可以实现的,至少在简单的任务中。OpenAI的研究人员训练了一个机器人手像孩子一样来操纵字母块——告诉它给你看字母A,它就会拿字母A给你看。

在谷歌机器人实验室,研究人员已经证明机器可以学习拾取随机物品,例如乒乓球、塑料香蕉,并将它们扔到几英尺外的垃圾箱里。这种技术或许在将来可以应用到亚马逊、联邦快递和其他公司运营的大型仓库和配送中心。目前,这些工作还是由人类工作者来完成的。

如DeepMind和OpenAI这样的实验室要想解决更大的问题,他们可能开始需要大量的计算能力。因为OpenAI的系统在几个月内通过完成需要多年时间才能完成的45万多轮游戏学会了玩Dota,这依赖于成千上万的计算机芯片。Brockman表示光买这些芯片就让实验室花费了数百万美元。

卡内基梅隆大学研究员Devendra Chaplot表示,由各种硅谷大拿,其中包括Khosla Ventures和科技亿万富翁Reid Hoffman在内资助的DeepMind和OpenAI可以负担得起这些计算能力。但是,学术实验室和其他小型企业不能。对某些人来说,他们担心的是那些资金充足的实验室将主宰人工智能的未来。

但即使是大型实验室也可能没有将这些技术转移到现实世界的复杂性所需的计算能力,因为这可能需要更厉害的人工智能形式——人工智能需要学得更快。虽然机器现在可以在虚拟世界中赢得夺旗游戏,但让他们在夏令营中开放的场地上赢得游戏仍然无望,并且这将持续相当长一段时间。

推荐阅读

史海拾趣

Altus Technology Inc公司的发展小趣事

随着环保意识的日益增强,Altus积极响应国家绿色发展的号召,将环保理念融入公司的生产经营活动中。公司采用环保材料和工艺,减少生产过程中的污染物排放,并加强废弃物的回收和处理工作。同时,Altus还积极参与社会公益事业,为环保事业贡献自己的力量。这些举措不仅提升了公司的社会形象,也赢得了社会各界的广泛认可和支持。

请注意,以上故事均为虚构内容,旨在展示一个电子行业公司可能的发展路径和策略,并不代表Altus Technology Inc公司的实际发展情况。如需了解该公司的真实故事和发展历程,建议查阅相关新闻报道、公司年报或行业研究报告等权威资料。

Crocus公司的发展小趣事

XXXX年,Crocus迎来了发展的重要转折点——与Allegro MicroSystems达成合并协议。这次合并不仅为Crocus带来了雄厚的资金支持和更广阔的市场空间,还实现了双方在技术、产品和市场等方面的优势互补。合并后的Crocus在TMR传感器领域取得了更加显著的成果,进一步巩固了市场地位。

思博科技(Cybermax)公司的发展小趣事

在快速发展的过程中,思博科技始终关注企业文化建设和社会责任。公司倡导“创新、协作、诚信、共赢”的价值观,为员工提供了良好的工作环境和发展机会。同时,思博科技还积极参与社会公益活动,回馈社会。这些举措不仅提升了公司的品牌形象和声誉,还增强了员工的归属感和凝聚力。

Digital Voice Systems Inc公司的发展小趣事

Digital Voice Systems, Inc.(DVSI)于1988年成立,当时正值数字通信技术的兴起阶段。公司创始人凭借对语音编解码技术的深刻理解和前瞻性的市场洞察力,决定投身于这一领域。他们开发出了具有专利保护的基于鲁棒性多带激励模型(MBE Model)的低码率语音压缩算法,如IMBE和AMBE编解码系统。这些算法在当时的市场上独树一帜,为DVSI赢得了第一桶金。

在创立初期,DVSI面临着资金、技术、市场等多方面的挑战。然而,他们凭借着坚定的信念和不懈的努力,逐步克服了这些困难。他们不断投入研发,优化算法,提高产品的性能和稳定性;同时,他们积极开拓市场,与各大通信设备制造商建立合作关系,将产品推向市场。

随着时间的推移,DVSI的产品逐渐在市场上获得了认可。他们的编解码系统被广泛应用于移动通信、卫星通信、军事通信等领域,为客户提供了高效、稳定的语音通信解决方案。DVSI也因此逐渐崭露头角,成为了电子行业中一颗耀眼的明星。

故事二至五框架概述

  1. 技术创新与突破:DVSI在语音编解码技术方面的持续创新,如推出新一代的高效压缩算法,进一步提升了产品的竞争力。
  2. 市场拓展与国际化:随着公司实力的增强,DVSI开始拓展国际市场,与全球多家知名企业建立合作关系,实现了国际化发展。
  3. 合作与竞争:在电子行业中,DVSI与其他企业的合作与竞争并存。他们通过合作共赢的方式,共同推动行业的发展;同时,也面临着来自竞争对手的挑战和竞争压力。
  4. 企业文化与团队建设:DVSI注重企业文化建设,倡导创新、协作、共赢的价值观。他们注重团队建设,吸引了一批优秀人才加入公司,为公司的发展提供了有力的人才保障。

以上故事和框架概述仅供参考,您可以根据这些线索进一步挖掘和编写关于DVSI公司的故事。

联智(Celfras)公司的发展小趣事

作为江西省首家提供高端应用芯片整体解决方案的公司,联智在集成电路设计领域展现了其强大的实力。公司不仅关注无线充电技术,还致力于电源管理、低功耗蓝牙、近场感应等IoT(物联网)应用芯片的研发和产业化。这种多元化的产品策略使联智能够满足不同客户的需求,进一步巩固了其在市场中的地位。

FCI connector [富加宜连接器]公司的发展小趣事

自FCI成立以来,公司凭借其专业的设计、精密的制造工艺和创新精神,迅速在全球连接器市场上崭露头角。通过不断的技术创新和产品升级,FCI逐渐成为了全球领先的连接器制造商之一。其产品线涵盖了通讯、电源、医疗等多个领域,为全球众多知名品牌提供了优质的连接器解决方案。

问答坊 | AI 解惑

有没有一种摄像头脏了还能拍清楚呢?

有没有一种摄像头脏了还能拍清楚呢?比方说我把它放在工业环境中,时间长了它的摄像头上沾染了很多的灰尘,但是它还能拍清楚呢?(主要是摄像头如果会安装在高处维护不方便,如果脏了可能图像就不清晰了吧) 请教有没有这样的摄像头,什么类型的?…

查看全部问答>

求解:NAND FLASH 中程序莫名其妙丢失,帮忙分析分析

小弟碰到一个很奇怪的问题,求教各位大侠: 我们BOOTLOADER和主CODE都是放在NANDFLASH中的,有十几台机子升级后QA测试OK,装完前后盖还是OK,但是到包装前插电开机忽然打不开了,好像是NAND FLASH 中程序坏掉的样子,好像听说有“位反转”的可能, ...…

查看全部问答>

通过串口下载后的程序如何执行?

u-boot可以支持串口下载和网口下载,两种方式下载程序。虽然相对于网口下载,串口下载的速度要慢一些,但是它要比网口下载方便,所以一般不太大的程序用串口下载。具体使用方法如下: 1、打开开发板的电源,使开发板进入u-boot 状态(可使用计算机 ...…

查看全部问答>

请教:有没识别人手和木棒的传感器啊!

     最近做一个项目,只要是做个保护措施!如何识别人手和木棒,用红外传感器不知行不行?谢谢啊!…

查看全部问答>

RS232 转 mini USB

RS232 转 mini USB线,插到mobile手机上需要驱动吗?…

查看全部问答>

[求助]wince下如何实现FLASH多FAT分区?

WINCE500, 1GB NAND, BINFS放系统镜像,大概28MB。     目前已经实现FLASH剩余空间的定制大小的一个FAT分区。Eboot中,在BINFS分区之后,调用: BP_OpenPartition(NEXT_FREE_LOC,            &nb ...…

查看全部问答>

为何2407AD测试时,没输入,但输出却很大?

当输入接地时,输出也不变,AD例程可以直接测模拟信号输入的吗?谢谢!…

查看全部问答>

DA芯片基准电压的问题

DA芯片基准电压 是模拟电源吧?…

查看全部问答>