历史上的今天
返回首页

历史上的今天

今天是:2025年01月28日(星期二)

2019年01月28日 | 10:1完胜!DeepMind推出最新人工智能 碾压《星际争霸2》职业玩家

2019-01-28 来源:猎云网

人们凭直觉认为,我们非常擅长自己创造出的游戏,但计算机一次又一次地证明,人类的速度还不够快,无法稳居宝座。机器不但在国际象棋在中击败了我们,甚至拿下了非常复杂的围棋。谷歌刚刚凭借AlphaGo获得了殊荣,却又一次创造了神话。仅仅18个月后,DeepMind的人工智能击败了最优秀的《星际争霸2》职业玩家,且二者实力相去甚远。

DeepMind将围棋人工智能称为AlphaGo,而给此次参与《星际争霸2》的人工智能,实验室依样称其为AlphaStar。论AlphaStar的训练强度,相当于已经打了200年的实战。AlphaStar是一种卷积神经网络。实验室首先回放职业比赛,让AlphaStar理解比赛如何开赛。通过在对抗模式下进行密集训练,DeepMind能够教会AlphaStar如何打比赛,告诉它哪些是优秀的职业玩家。随着时间推移,AlphaStar将会把学习范围缩小至五名最优秀的玩家身上,这也是它对抗《星际争霸2》职业玩家的方式。

比赛实际上是在去年12月进行的,所以今天互联网上流传的大多是先前比赛的回放。首先,AlphaStar与玩家TLO进行作战,虽然玩家惯常以虫族角色打比赛,但由于AlphaStar只进行了特定角色的训练,所以TLO必须打神族角色。这场比赛实力悬殊,尽管TLO尽了最大的努力,AlphaStar还是以5:0的成绩击败了他。接下来,AlphaStar与另一名经验丰富的神族玩家MaNa进行对决。虽然其中几场比赛MaNa还有希望,但AlphaStar最终也以5:0的比分获胜。而后MaNa要求再赛一局,同时抓住了AlphaStar的缺陷,因而拿下了加赛的一局。

在整场比赛中,AlphaStar展示了令人印象深刻的微观管理(Micromanagement)能力。它能迅速将受损部队移回,将更强的部队移入战斗前线。AlphaStar还控制了战斗的节奏,在适当的时间让部队前进,并在合适的时机撤退,以此减少伤害。这和每分钟操作数(Actions Per Minute,下文简称APM)无关,因为AlphaStar的APM其实比职业玩家低很多,但是它能够做出更明智的选择。

AlphaStar也有一些有趣的战略癖好,它经常让部队在坡道上冲锋,但这在《星际争霸2》中是很危险的选择,因为在向上冲时视野是受限的。但不知何故,AlphaStar的这一策略也发挥了作用。职业玩家经常使用建筑墙来封锁基地坡道,但AlphaStar并没有采取这一战术。

直到最后一场比赛,职业玩家MaNa才发现 AlphaStar的缺陷,也就是它习惯整体移动部队,集中攻打MaNa的基地。不过,MaNa只要在AlphaStar的基地后面的传送几支部队,那么AlphaStar就会立刻调转方向应对威胁,如此反复就给了MaNa足够的时间来组建更强大的力量,瓦解AlphaStar的攻击。AlphaStar在与职业玩家的比赛中赢得了10场比赛,只输了1场。如果AlphaStar从这一场输掉的比赛中吸取教训,那么未来它可能战无不胜。

作者:Ryan Whitwam

推荐阅读

史海拾趣

EOREX公司的发展小趣事

在电子产品质量参差不齐的市场环境下,EOREX公司始终坚持品质至上的原则。他们严格把控生产过程中的每一个环节,确保产品的质量和性能达到最高标准。同时,EOREX还建立了完善的售后服务体系,为客户提供及时、专业的技术支持和解决方案。这些举措使得EOREX的产品在市场上赢得了良好的口碑和信赖度,为公司的发展奠定了坚实的基础。

CNC Tech公司的发展小趣事

随着科技的不断发展,CNC Tech公司意识到,只有不断创新才能在行业中保持领先地位。因此,公司加大了对研发创新的投入,积极引进和培养高端人才,加强与高校和科研机构的合作。在CNC Tech的努力下,公司成功研发出一系列具有创新性的数控加工技术和产品,不仅提高了生产效率和质量,还降低了生产成本,为客户创造了更大的价值。这些创新成果也引领了行业的技术变革和发展趋势。

Defender Security公司的发展小趣事

随着网络安全问题的全球化趋势日益明显,Defender Security公司开始积极拓展国际市场。他们与多家国际知名的网络安全企业建立了合作关系,共同应对全球网络安全挑战。通过技术交流和合作研发,Defender Security不断提升自己的国际竞争力,逐渐成为了全球网络安全领域的重要力量。

DECON公司的发展小趣事

品质是企业的生命线,DECON公司深知这一点。因此,公司建立了完善的品质管理体系,从原材料采购到生产过程的每一个环节都进行严格的质量监控。公司引进了先进的生产设备和技术,优化了生产流程,提高了生产效率和产品质量。同时,公司还建立了完善的售后服务体系,为客户提供及时、高效的技术支持和解决方案。

AC Interface Inc公司的发展小趣事

ABC Electronics Inc. 深知人才是企业发展的核心动力。因此,公司高度重视人才培养和引进工作。一方面,公司建立了完善的人才培养机制,通过内部培训、轮岗锻炼等方式提升员工的技能和素质;另一方面,公司积极引进具有创新精神和国际视野的高端人才,为公司的技术创新和市场拓展提供了有力支撑。这些人才战略的实施,为公司的长远发展奠定了坚实基础。

这些故事虽然是以虚构的ABC Electronics Inc.为例,但其中的情节和策略在电子行业中是普遍存在的。如果AC Interface Inc是一个真实存在的公司,它的发展轨迹可能也会涉及这些方面。当然,具体的故事还需要根据公司的实际情况来创作。

潮州三环(Three-circle)公司的发展小趣事

面对能源危机的挑战和新能源市场的崛起,三环集团决定进军新能源领域。在2004年,公司开始研发生产燃料电池电解质基片(SOFC),这是一种能够将化学能转化为电能的装置。通过多年的努力,三环集团成功实现了SOFC的量产,并将其应用于新能源汽车、分布式发电等领域。这一布局不仅展示了公司的前瞻性和创新能力,也为公司带来了新的发展机遇。

问答坊 | AI 解惑

电化学整流电源的设计

    摘要:介绍电化学整流电源及其设计,结合国内外发展的情况,对系统设计的目前状况和发展趋势进行了综述。 关键词:电化学整流电源设计方法   电化学整流电源主要用做铝镁电解、食盐电解、其它金属电解、水电解等设备的直流电源,其 ...…

查看全部问答>

dsp入门----> dsp的精品课件!

dsp是强大的芯片,设计的技术很多,很杂,特别是一dsp作为核心的时候!现在大致有两种系统,一种是主从式的,说简单一点就是dsp和主机打交道!一种是dsp自成体系的,这个时候所有的控制,处理工作都是有dsp器件完成的,这样的系统一般都有自举引导 ...…

查看全部问答>

电涡流测功机工作原理

  由电涡流测功机感应子主要由旋转部分和摆动部分(电枢和励磁线圈)组成。转子轴上的感应子形状犹如齿轮,与转子同轴装有一个直流励磁线圈。当励磁线圈组通以直流电流时,其周围便有磁场存在,那么围绕励磁组就产生一闭合磁通。很明显,位于绕组 ...…

查看全部问答>

LM3S8962 MAC地址写入问题

问题: 要修改 LM3S8962 MAC Address 是否从下列圆中输入就行了,如可以要量产时是否也要一片一片板子来修改?? 再请教一下,有没有 LM Flash programmer  S/W  操作手冊可看 答案:    用从标注的选项里面修改。因 ...…

查看全部问答>

请教cadence画原理图问题

请教cadence画原理图时, 我把CPU分成3部分 想画在三个PAGE上 请问怎么才能让这三个PAGE连接起来…

查看全部问答>

关于pb5.0,每次打开要几分钟才响应,是怎么回事呢?

每次打开软件要几分钟才响应,是怎么回事呢?有没什么解决的办法?打开一个工程稍微短一点。显示在打开网页*start*…

查看全部问答>

提个意见:STM32为什么不提供SCH/PCB库?

                                 有用PROTEL的,有用PADS的。别的公司都有了,为什么STM32就没有?…

查看全部问答>

[TI M4申请]自主智能汽车运动控制和姿态测量系统(inemo入围项目)

自主智能汽车运动控制和姿态测量系统一、项目概述1.1 项目摘要本系统的目的是设计一种以IMEMS传感器为主的自主路径识别智能汽车的运动控制和测量系统。本系统采用双MCU架构, STM32F103 MCU负责车身信号的采集,各模块电源的管理和地磁传感器,陀螺 ...…

查看全部问答>

msp430F5438A 24M外部晶振震荡幅度很小

使用MSP430F5438A 做实验板,XT2外接24M晶振,两个22PF电容接地。使用TI官网示例代码测试,发现晶振震荡频率正确但幅度最大为0.7V,峰峰值为0.45V,不知道这样的结果是不是正常?更换电容和8M晶振后问题依旧。使用100MHZ示波器测量。希望大家帮忙讲 ...…

查看全部问答>