历史上的今天
今天是:2025年01月28日(星期二)
2019年01月28日 | 10:1完胜!DeepMind推出最新人工智能 碾压《星际争霸2》职业玩家
2019-01-28 来源:猎云网
人们凭直觉认为,我们非常擅长自己创造出的游戏,但计算机一次又一次地证明,人类的速度还不够快,无法稳居宝座。机器不但在国际象棋在中击败了我们,甚至拿下了非常复杂的围棋。谷歌刚刚凭借AlphaGo获得了殊荣,却又一次创造了神话。仅仅18个月后,DeepMind的人工智能击败了最优秀的《星际争霸2》职业玩家,且二者实力相去甚远。
DeepMind将围棋人工智能称为AlphaGo,而给此次参与《星际争霸2》的人工智能,实验室依样称其为AlphaStar。论AlphaStar的训练强度,相当于已经打了200年的实战。AlphaStar是一种卷积神经网络。实验室首先回放职业比赛,让AlphaStar理解比赛如何开赛。通过在对抗模式下进行密集训练,DeepMind能够教会AlphaStar如何打比赛,告诉它哪些是优秀的职业玩家。随着时间推移,AlphaStar将会把学习范围缩小至五名最优秀的玩家身上,这也是它对抗《星际争霸2》职业玩家的方式。
比赛实际上是在去年12月进行的,所以今天互联网上流传的大多是先前比赛的回放。首先,AlphaStar与玩家TLO进行作战,虽然玩家惯常以虫族角色打比赛,但由于AlphaStar只进行了特定角色的训练,所以TLO必须打神族角色。这场比赛实力悬殊,尽管TLO尽了最大的努力,AlphaStar还是以5:0的成绩击败了他。接下来,AlphaStar与另一名经验丰富的神族玩家MaNa进行对决。虽然其中几场比赛MaNa还有希望,但AlphaStar最终也以5:0的比分获胜。而后MaNa要求再赛一局,同时抓住了AlphaStar的缺陷,因而拿下了加赛的一局。
在整场比赛中,AlphaStar展示了令人印象深刻的微观管理(Micromanagement)能力。它能迅速将受损部队移回,将更强的部队移入战斗前线。AlphaStar还控制了战斗的节奏,在适当的时间让部队前进,并在合适的时机撤退,以此减少伤害。这和每分钟操作数(Actions Per Minute,下文简称APM)无关,因为AlphaStar的APM其实比职业玩家低很多,但是它能够做出更明智的选择。
AlphaStar也有一些有趣的战略癖好,它经常让部队在坡道上冲锋,但这在《星际争霸2》中是很危险的选择,因为在向上冲时视野是受限的。但不知何故,AlphaStar的这一策略也发挥了作用。职业玩家经常使用建筑墙来封锁基地坡道,但AlphaStar并没有采取这一战术。
直到最后一场比赛,职业玩家MaNa才发现 AlphaStar的缺陷,也就是它习惯整体移动部队,集中攻打MaNa的基地。不过,MaNa只要在AlphaStar的基地后面的传送几支部队,那么AlphaStar就会立刻调转方向应对威胁,如此反复就给了MaNa足够的时间来组建更强大的力量,瓦解AlphaStar的攻击。AlphaStar在与职业玩家的比赛中赢得了10场比赛,只输了1场。如果AlphaStar从这一场输掉的比赛中吸取教训,那么未来它可能战无不胜。
作者:Ryan Whitwam
史海拾趣
|
摘要:介绍电化学整流电源及其设计,结合国内外发展的情况,对系统设计的目前状况和发展趋势进行了综述。 关键词:电化学整流电源设计方法 电化学整流电源主要用做铝镁电解、食盐电解、其它金属电解、水电解等设备的直流电源,其 ...… 查看全部问答> |
|
dsp是强大的芯片,设计的技术很多,很杂,特别是一dsp作为核心的时候!现在大致有两种系统,一种是主从式的,说简单一点就是dsp和主机打交道!一种是dsp自成体系的,这个时候所有的控制,处理工作都是有dsp器件完成的,这样的系统一般都有自举引导 ...… 查看全部问答> |
|
由电涡流测功机感应子主要由旋转部分和摆动部分(电枢和励磁线圈)组成。转子轴上的感应子形状犹如齿轮,与转子同轴装有一个直流励磁线圈。当励磁线圈组通以直流电流时,其周围便有磁场存在,那么围绕励磁组就产生一闭合磁通。很明显,位于绕组 ...… 查看全部问答> |
|
问题: 要修改 LM3S8962 MAC Address 是否从下列圆中输入就行了,如可以要量产时是否也要一片一片板子来修改?? 再请教一下,有没有 LM Flash programmer S/W 操作手冊可看 答案: 用从标注的选项里面修改。因 ...… 查看全部问答> |
|
[TI M4申请]自主智能汽车运动控制和姿态测量系统(inemo入围项目) 自主智能汽车运动控制和姿态测量系统一、项目概述1.1 项目摘要本系统的目的是设计一种以IMEMS传感器为主的自主路径识别智能汽车的运动控制和测量系统。本系统采用双MCU架构, STM32F103 MCU负责车身信号的采集,各模块电源的管理和地磁传感器,陀螺 ...… 查看全部问答> |
|
使用MSP430F5438A 做实验板,XT2外接24M晶振,两个22PF电容接地。使用TI官网示例代码测试,发现晶振震荡频率正确但幅度最大为0.7V,峰峰值为0.45V,不知道这样的结果是不是正常?更换电容和8M晶振后问题依旧。使用100MHZ示波器测量。希望大家帮忙讲 ...… 查看全部问答> |




