历史上的今天
返回首页

历史上的今天

今天是:2025年03月26日(星期三)

正在发生

2018年03月26日 | 对抗性神经网络凭啥入选MIT2018十大突破性技术

2018-03-26 来源:智造大视野

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

在自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。

来源:科技日报 作者:房琳琳

推荐阅读

史海拾趣

Fine Products Microelectronics Corp公司的发展小趣事

Fine Products Microelectronics Corp公司发展故事(虚构)

故事一:技术创新引领市场

Fine Products Microelectronics Corp(简称FPMC)自创立之初便致力于半导体技术的创新。在上世纪90年代,当半导体行业还普遍使用传统光刻技术时,FPMC的研发团队率先提出了步进式光刻机(Wafer Stepper)的概念。这一创新极大地提高了芯片制造的精度和效率,使得芯片特征尺寸得以大幅缩小。尽管初期面临技术难度大、市场接受度低等挑战,但FPMC凭借坚持不懈的努力,最终成功研发出并量产了步进式光刻机,迅速在半导体制造领域占据了领先地位。

故事二:与巨头的合作与竞争

在FPMC的成长过程中,与行业内巨头的合作与竞争是不可或缺的一部分。特别是在21世纪初,FPMC与IBM、TI等知名企业建立了合作关系,共同推进半导体技术的研发和应用。然而,这种合作并非一帆风顺,FPMC在某些关键技术上坚持自主研发,与IBM的电子束光刻(e-beam)技术产生了竞争。尽管这种竞争给FPMC带来了一定的压力,但也促使公司不断加大研发投入,提升技术实力,最终形成了自己独特的竞争优势。

故事三:石墨烯电极技术的突破

近年来,随着二维材料研究的兴起,FPMC紧跟科技前沿,成功研发出了石墨烯辅助金属电极转印技术。这一技术利用石墨烯与金属间较弱的范德华作用力,实现了金属电极阵列在二维沟道材料上的无损转移。该技术不仅提高了电极的制备精度和效率,还降低了制造成本,为二维芯片的应用开辟了新的路径。FPMC的这一创新成果迅速获得了业界的关注和认可,进一步巩固了公司在半导体材料领域的领先地位。

故事四:物联网时代的布局

随着物联网技术的快速发展,FPMC敏锐地捕捉到了这一市场机遇。公司及时调整战略方向,加大了对物联网相关产品的研发力度。通过与多家物联网企业和研究机构的合作,FPMC成功推出了一系列高性能、低功耗的物联网芯片和解决方案。这些产品广泛应用于智能家居、智慧城市、工业控制等领域,为物联网的普及和发展提供了强有力的支持。

故事五:绿色可持续发展

在追求技术创新和市场拓展的同时,FPMC始终不忘企业的社会责任。公司积极响应全球绿色可持续发展的号召,致力于研发环保型半导体产品和制造工艺。通过采用先进的节能减排技术和循环利用材料等手段,FPMC不仅降低了自身的生产成本和能耗水平,还为推动半导体行业的绿色可持续发展做出了积极贡献。此外,公司还积极参与社会公益活动,为构建和谐社会贡献自己的一份力量。

American Electric公司的发展小趣事

随着全球化进程的加速,American Electric公司开始实施国际化战略。公司积极拓展海外市场,与多个国家的电力企业建立合作关系,共同开展电力项目。同时,公司还在海外设立了多个分支机构,以便更好地服务当地客户。这些举措不仅提高了公司的国际影响力,还为公司的长期发展奠定了坚实的基础。

Corstat Containers公司的发展小趣事

为了进一步拓展国际市场,Corstat Containers公司积极寻求与国际知名电子企业的合作。通过参加国际电子展会、建立海外销售渠道等方式,公司成功打开了多个国家的市场。同时,公司还与国外科研机构展开合作,共同研发更加先进的电子产品包装技术,为公司的长期发展奠定了坚实的基础。

巨盛电子(Chesen)公司的发展小趣事

随着环保意识的提高,消费者对环保产品的需求也越来越高。巨盛电子(Chesen)积极响应环保号召,将环保理念融入产品设计和生产过程中。公司采用环保材料、优化生产工艺、加强废弃物处理等措施,减少了对环境的污染。同时,公司还积极开展环保宣传活动,提高了消费者对环保产品的认识和接受度。这些举措不仅塑造了巨盛电子的环保品牌形象,还为企业赢得了更多消费者的支持。

蓝箭(BLUE ROCKET)公司的发展小趣事

蓝箭电子始终重视创新能力,不断加大研发投入,推动产品的升级换代。公司还积极拓展国际市场,寻求更多的合作机会。未来,蓝箭电子将继续秉承创新、质量、服务的理念,为电子行业的发展贡献更多力量。

这些故事仅是对蓝箭电子在电子行业发展中一些重要节点的概括,具体的发展过程和细节可能还需要进一步了解公司的历史资料和市场动态。希望这些信息能够满足您的需求。

歌普(GEPU)公司的发展小趣事

为了提高产品质量和客户满意度,蓝箭电子从1997年开始通过ISO9001质量管理体系认证。随后,公司还通过了ISO14001环境管理体系认证、ISO/TS16949汽车行业质量管理体系标准认证以及OHSAS18001认证。这些认证不仅提升了公司的管理水平,也增强了客户对公司的信任。

问答坊 | AI 解惑

AD210接线

谁使用过AD210? 我想使用它的电压放大功能以及与GND不一致的com端,我按照datasheet的fig.3接线并在14,15,3,4管脚处连接了1uF 50V的电容,输出端用了RC低通滤波器,可是当我输入电压时,AD210完全不动作,谁能告诉我原因啊?第一次使用,周围 ...…

查看全部问答>

wince中CString转char*的问题

在wince中讲CString(包含汉字)转换成char*用GetBuffer的方法转换行不通,请问应该如何转换…

查看全部问答>

WINCE 上网提示内存不足,然后挂住了!

在板子上用WINCE 上网,打开一些网页后,就提示内存不足,需要关闭进程,但我还没有选择, 系统就在这个提示界面挂住了,本以为系统在显示这个提示时,保留的剩余内存不够 而引起的,但在我修改了相关的参数后,增大了上述的保留内存,但没有效果 ...…

查看全部问答>

.net 2003 智能设备应用程序可以直接安装到wince系统上吗?

.net 2003 智能设备应用程序可以直接安装到wince系统上吗? 我在.net自带的模拟器上调试通过了! 望知情的同仁多多赐教!…

查看全部问答>

谁讲讲‘句柄’这个东西应该怎么理解。。。

呵呵,不懂PC编程,看着吃力。。。怎么看着像个指针?…

查看全部问答>

iphone电子秤

威龙科技半导体是方案公司,提供IPHONE IPAD 电子秤方案,IPAD电子秤是高技术的电子秤,工厂只需解决一个承重平台,将信息传递给IPAD就可以了.…

查看全部问答>

【个人低价转让】全新TMS320C6713DSK开发板

TMDSDSK6713 DSP初学者开发套件(DSK)具有如下性能: TMS320C6713 CPU 每秒225MHz工作主频; 512K外部Flash,8MB外部SDRAM; 24位立体声接口,包括一路Micphone;自带JTAG仿真功能的USB主机接口;外带DSP JTAG仿真接口;支持DSK的最新2.20版本CCS调 ...…

查看全部问答>

加速度传感器与角度传感器的关系

本帖最后由 paulhyde 于 2014-9-15 04:02 编辑 这次电赛的清单里有角度传感器,于是大家都很迅速的在网上买了现成的模块,买回来一看,发现并不是很理想。其实很多人买到的是加速度传感器,那么二者之间有什么关系呢?加速度传感器能不能当角度传 ...…

查看全部问答>

【M4 开发板入门】EKK-LM4F232的spmu272文件的SCH问题

spmu272文件第25页 红色部分:在SCH那里有几处GND漏连接! 兰色部分:不明白为什么这个VDDC不用连接正电源的吗?? VDDC在PDF的解释如下: Positive supply for most of the logic function, including theprocessor core and most peripherals ...…

查看全部问答>

DS1302&LCD1602显示时间程序中出现部分问题求解

#include #include #define uchar unsigned char #define write_second 0x80 #define read_second 0x81 #define write_minute 0x82 #define read_minute 0x83 #define write_hour 0x84 #define read_hour 0x85 #define write_day 0x86 ...…

查看全部问答>