历史上的今天
返回首页

历史上的今天

今天是:2025年03月19日(星期三)

正在发生

2018年03月19日 | AI版“双手互搏”有多牛

2018-03-19 来源:中国科技网

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

在自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。(记者 房琳琳)

推荐阅读

史海拾趣

Ametherm公司的发展小趣事

Ametherm公司成立于XXXX年,由一群热衷于电子技术的工程师创立。他们看到了功率热敏电阻在电子行业中的巨大潜力,并决定专注于此领域的发展。在创立初期,公司面临着资金短缺、市场竞争激烈等挑战,但创始人们凭借着对技术的热情和坚持,逐步攻克了技术难关,开发出了具有竞争力的产品。

FILTRONETICS Inc公司的发展小趣事

FILTRONETICS Inc成立于1970年代,初期专注于滤波器技术的研发与生产。在那个时代,随着通信技术的快速发展,对高质量滤波器的需求日益增长。公司研发团队通过不懈努力,成功研发出了一种新型LC滤波器,该滤波器在频率选择性和插入损耗方面表现出色,迅速获得了市场的认可。这一技术突破不仅巩固了FILTRONETICS在滤波器领域的地位,也为公司的后续发展奠定了坚实的基础。

东软载波(EastSoft)公司的发展小趣事

东软载波公司成立于1993年,自成立之初就专注于电力载波通信技术的研发。公司在1996年开始了电力线载波通信技术的深入研究,经过数年的努力,终于在2000年推出了第一代电力线载波通信芯片。这一成果标志着东软载波在电力载波通信领域取得了重要突破,为其后续发展奠定了坚实的基础。

ABOV(现代单片机)公司的发展小趣事

凭借卓越的产品性能和技术实力,东软载波获得了多项荣誉和认证。公司被评为“国家绿色工厂”,多款产品通过国内外权威认证。同时,公司还荣获了多项行业奖项和荣誉称号,如“2022 PLC互联互通·基石奖”、“2022年山东民营企业新一代信息技术行业领军10强”等。这些荣誉的获得充分证明了东软载波在电子行业中的领先地位和实力。

ABCircuits公司的发展小趣事

ABCircuits公司始终坚信人才是企业发展的核心动力。因此,公司在人才招聘和培养方面投入了大量资源。通过与高校和研究机构的合作,ABCircuits吸引了一批批优秀的科研人才加入公司。同时,公司还建立了完善的培训体系,为员工提供持续的学习和成长机会。这些人才为公司带来了源源不断的创新动力,推动了公司的快速发展。

亿晶源(ekinglux)公司的发展小趣事

在不断提升产品质量和创新能力的同时,亿晶源还积极拓展市场。公司先后在华南、华东等地区设立生产基地和销售中心,形成了覆盖全国的销售网络。同时,公司还注重品牌建设,通过参加国内外知名展会、举办技术交流会等活动,提升品牌知名度和影响力。

问答坊 | AI 解惑

寻求ARM及8位单片机高手

有个单子要交,需要用到单片机,高薪寻求高手合作。有意请加QQ:85288499,请注明:单片机…

查看全部问答>

阳初s3c2410 的一些问题,刚买了他们的东西,他们的论坛就崩溃了。。。。求救

1.vivi下net ping 命令无效。 那个网卡我来描述一下什么情况:买的时候给的是网线直连线,拿板直接接主机板子的灯是不会亮的,我尝试过那主机和板子都接路由器,灯是亮了,但是net ping 命令 ping不到任何东西,就显示arp broadcast 1,net set ip ...…

查看全部问答>

《STM32系列ARMCortex-M3微控制器原理与实践>>出书效率太低了!

                                 《STM32系列ARM Cortex-M3微控制器原理与实践>>出书效率太低了!《基于MDK的STM32处理器开发应用》马上也 ...…

查看全部问答>

Mini-STM32学习板。---新增了几个配件及方案

Mini-STM32学习板,开发板。¥88元(不含邮费和税)。现货。价格合理,主要为方便大家体验STM32而推出的。也让大家多一个选择!QQ:583508038 ,msn:ljq66194052@hotmail.com , TEL :023-66194052 ²   ...…

查看全部问答>

MSP430F149的 2K RAM够用吗?

为了维持系统的稳定运行,请问我在设置全局变量时最好不要超过多少个字节? 如果出现RAM不够用,对于430来说是怎么处理的呢?系统自动重启吗?…

查看全部问答>

有关中断式键盘

这中断式键盘还真麻烦,我通过一个按键连接VCC和P1.2,想法是按键就会对P1.2产生上升沿,从而执行中断服务程序,结果,一加电就自行进入中断服务程序,根本不管按没按键,高手们,指点指点呀!! 这中断式键盘到底怎么搞啊,是不是都不采用这种人 ...…

查看全部问答>

[分享] 如何优化C语言代码(程序员必读

1、选择合适的算法和数据结构应该熟悉算法语言,知道各种算法的优缺点,具体资料请参见相应的参考资料,有很多计算机书籍上都有介绍。将比较慢的顺序查找法用较快的二分查找或乱序查找法代替,插入排序或冒泡排序法用快速排序、合并排序或根排序代 ...…

查看全部问答>

继电器的问题

我在做演示板,上面加了两个红绿LED灯,平时红灯亮,刷卡继电器动作绿灯亮,LED灯的电流为20MA,只在COM端接了一个+12V,其它都还没有接一上电就全烧了,请问是什么问题 [ 本帖最后由 zjjone1023 于 2011-5-21 14:37 编辑 ]…

查看全部问答>

Zigbee能否用于工厂叉车与轨道车定位?

对无线定位比较感兴趣,发现目前用的比较多的方案有UWB和Zigbee、WIFI。 Symeo有UWB方案,精度能达到5cm,但是价格非常昂贵,实在用不起。 Zigbee和WIFI都是基于RSSI的,精度比较低,不知道能否应用于运动车辆的定位?…

查看全部问答>

TI针对大学生的微博

TI芯学院   http://e.weibo.com/ticampus/profile…

查看全部问答>