历史上的今天
今天是:2025年02月15日(星期六)
2019年02月15日 | Facebook首次开源超级围棋AI 复现AI高手AlphaZero
2019-02-15 来源:镁客网
最近,Facebook的人工智能研究所(以下简称FAIR)宣布,他们开源了自研的围棋AI训练模型和代码。这意味着,你可以随时随地和Facebook的人工智能下围棋了,而且此围棋AI程序重现的是名噪一时的AI高手AlphaZero。
去年5月,FAIR发布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上发表的和AlphaGo Zero以及AlphaZero相关的论文,做出的开源计算机围棋程序,也就是说,ELF OpenGo不使用人类棋谱与累积的围棋知识,仅使用单一类神经网络从自我对弈中学习。
该围棋AI之前在和韩国棋院的专业围棋选手对弈中,都取得不错的成绩。据悉,OpenGo 的最新版本使用2000块GPU训练了15天后,在一块GPU的情况下与4个排名前30的职业选手进行比赛时,取得了20:0全胜的战绩,可谓是战无不胜。
在这次开源的论文中,FAIR研究人员全面披露了ELF OpenGo的训练过程,包括取得的是三个突破。
一是为ELF OpenGo训练了一个超人类棋艺的模型,他们在2000个GPU上运行类AlphaZero的训练软件9天后,有20个模块的模型超越了人类水平。
二是提供了模型在训练过程中的行为分析,包括和其他模型的对比、学习速度、学习难度等等。
三是通过实施ablation实验,以研究AlphaZero风格算法的性质,他们发现对于最终模型而言,对局中加倍rollout水平大约提升200 ELO,AI的发挥会受到模型容量的限制。
最后,此次论文的主要作者为田渊栋,他一直负责Facebook的围棋AI相关研究,在此前的一篇知乎文章中,他提到:DeepMind不开源也不透露细节,文章里面一些地方也没有写得很清楚。没有第一手经验总不是很踏实。所以本着研究目的,我们需要复现一下,先有复现,才有创新,这个是做研究的习惯。而且如果我们去看 ELF OpenGo 的代码,会发现其完全适用于其它方向的工作。而围棋对我们来说,只是一个把算法和平台做好的手段。在这一点上,花点时间把围棋做好是值得的。
史海拾趣
|
摘要: 从PCI时序分析入手,重点阐述了PCI通用的状态机设计,说明了用VHDL语言来实现本PIC通信状态机的软件设计以及进行MaxPlusII验证的程序和方法。用该方法所设计的接口既可支持PCI常规传输,又可支持PCI猝发传输。 关键词: PCI时序 CPLD器件 ...… 查看全部问答> |
|
看了几眼数据手册,突然发现,LPC343居然支持USB ISP 下载。也就是说,你不用任何下载器或调试器,只用一个usb口就可以把程序下载到LPC1343里,这在普通的8位,16位单片机和ARM7上是绝无仅有的。 也就是说,PIO_01 (板上丝印为FT/GPIO)= LOW ...… 查看全部问答> |
|
我的屏幕的分辨率为800*480.那么对应的屏幕坐标为(3200,1920)?。。我现在出现的问题是,平常的操作基本正常,但是无法出现右键,AYGSHELL组件也已经选了。是不是抖动问题?但是我在DdsiTouchPanelGetPoint中保存第一次按下时的坐标,在弹起之前 ...… 查看全部问答> |
|
在windML配置时,我用的是工具配置的方法,我用的是X86 pentium3的处理器,在选用鼠标和键盘时我选的是ps2 style pointer和pc/AT style的键盘,name分别是/pcConsole/0和/pcConsole/1,配置完成后,做vxworks映像时,我若选择添加ps2 mouse和ps2 key ...… 查看全部问答> |
|
支持STM32串口ISP,和STM8S系列的SWIM编程。1、自动增量(序列号)功能。2、全脱机工作,可电池供电和USB接口供电(可选配+5VUSB电源适配器)。3、支持STM32串口ISP,和STM8S系列的SWIM编程。4、支持STM32的串口IAP。5、可选配DB9的RS232转换器和RS4 ...… 查看全部问答> |
|
哪个大虾能列出几个具体的型号对应具体的应用实例,谢谢了 如: MSP430XFXX-------->XX表 我经常用S3F9454------>电饭煲 S3F9454------>牛排机… 查看全部问答> |
|
大家好,我刚学bootloader,在看boot_serial这个官方的例子。我的板子是TI 的LM3S9B96.有几个问题想请教下。1.boot_serial这个工程怎么没有main函数,先运行那个函数呢?2.我使能了强制升级按键“ENABLE_UPDATE_CHECK”,在bl_check.c中怎么判断按 ...… 查看全部问答> |




