历史上的今天
返回首页

历史上的今天

今天是:2025年02月08日(星期六)

正在发生

2019年02月08日 | 英伟达“AI假脸王”开源:新一代GAN攻破所有人脸识别系统

2019-02-08 来源:新智元

还记得英伟达去年推出的StyleGAN吗?全新的生成器架构让这个“新一代GAN”生成的人脸真实到可怕。现在,StyleGAN已经开源,包括源代码和官方TensorFlow实现,附有详细使用说明。多说一句,还请谨慎使用,不要让StyleGAN成为第二个DeepFake。

还记得英伟达震撼世人的

新一代GAN

吗?

以假乱真的精细人脸生成,令不少研究人员都惊呼:已经无法分辨虚拟和现实!

上述人脸全部由计算机生成,StyleGAN的全新风格迁移生成器架构能控制发色、眼睛大小等脸部特征。来源:github.com/NVlabs/stylegan

论文、源代码、高清Flickr人脸图像数据集等所有的材料都公布了出来,非商业使用的情况下,这些素材任你使用和修改(Flickr人脸数据集参考另外的开源协议)。

Github库里还包含了一个基础的预训练StyleGAN生成器pretrained_example.py,下载后使用相关Python代码,就可以直接用来生成图像了。

另一个更高级的样例是generate_figures.py,这个脚本是用来生成论文中风格变换/混合、鼻子大小和发色调整等功能。

不过,需要提前说明的是,要生成1024*1024分辨率的图像,如果使用英伟达Tesla V100 GPU做训练,硬件配置和训练时间如下:

“使用较少的GPU可能无法实现与论文同样的效果——如果你想跟我们的技术一较高下,我们强烈推荐你使用同样数量的GPU。”

开源StyleGAN,莫非还有一丝卖显卡的因素(误)。

新一代StyleGAN:图像逼真到可怕,能生成世界万物

基于GAN的架构一个又一个推出,要是你一时间想不起来StyleGAN也没关系,多上几张图有助于你回忆:

这个模型并不完美,但确实有效,而且不仅仅可用于人类,还能用于汽车、猫、风景图像的生成。

英伟达研究人员在论文中写道,他们提出的新架构可以完成自动学习,无监督地分离高级属性(例如在人脸上训练时的姿势和身份),以及生成图像中的随机变化,并且可以对合成进行更直观且特定于比例的控制。

换句话说,这种新一代GAN在生成和混合图像,特别是人脸图像时,可以更好地感知图像之间有意义的变化,并且在各种尺度上针对这些变化做出引导

例如,在上面的动图中,其实面部已经完全变了,但“源”和“样式”的明显标记显然都得到了保留。为什么会这样?请注意,所有这些都是完全可变的,这里说的变量不仅仅是A + B = C,而且A和B的所有方面都可以存在/不存在,具体取决于设置的调整方式。

而StyleGAN之所以强大,就在于它使用了基于风格迁移的全新生成器架构:

传统生成器架构和基于风格的生成器架构对比

在传统方式中,隐码(latent code)是通过输入层提供给生成器的,即前馈网络的第一层(图1a)。而英伟达团队完全省略了输入层,从一个学习的常量(learned constant)开始,从而脱离了传统的设计(图1b,右)。在输入隐空间Z中,给定一个隐码z,一个非线性网络 f:ZW首先生成w∈W(图1b,左)。

英伟达团队的生成器架构可以通过对样式进行特定尺度的修改来控制图像合成。可以将映射网络和仿射变换看作是一种从学习分布(learned distribution)中为每种样式绘制样本的方法,而将合成网络看作是一种基于样式集合生成新图像的方法。修改样式的特定子集可能只会影响图像的某些方面。

负责任地使用,避免成为又一个“DeepFake”

之前,大多数研究都集中在如何提高“换脸”技术上,也就是如何让计算机生成超逼真的人脸。

谁料,这种技术发展的滥用造成了反效果,也即所谓的“DeepFake”。现在,DeepFake已被用于指代所有看起来或听起来像真的一样的假视频或假音频。

去年底,Idiap 生物识别安全和隐私小组负责人 (注:Idiap研究所是瑞士的一家半私人非营利性研究机构,隶属于洛桑联邦理工学院和日内瓦大学,进行语音、计算机视觉、信息检索、生物认证、多模式交互和机器学习等领域的研究)、瑞士生物识别研究和测试中心主任 Sébastien Marcel 和他的同事、Idiap 研究所博士后 Pavel Korshunov 共同撰写了论文,首次对人脸识别方法检测 DeepFake 的效果进行了较为全面的测评

他们经过一系列实验发现,当前已有的先进人脸识别模型和检测方法,在面对 DeepFake 时基本可以说是束手无策——性能最优的图像分类模型 VGG 和基于 Facenet 的算法,分辨真假视频错误率高达 95%;基于唇形的检测方法,也基本检测不出视频中人物说话和口型是否一致。

Pavel Korshunov 和 Sébastien Marcel 指出,随着换脸技术的不断发展,更加逼真的 DeepFake 视频,将对人脸识别技术构成更大的挑战。

“在 DeepFake 方法和检测算法之间的一场新的军备竞赛可能已经开始了。”

StyleGAN的开源,无疑也会增强DeepFake的制作。因此,谷歌大脑研究员Eric Jang呼吁,请负责任地使用!


推荐阅读

史海拾趣

COMPEX公司的发展小趣事

在追求经济效益的同时,COMPEX公司也积极履行社会责任,注重可持续发展。公司致力于减少生产过程中的环境污染,采用环保材料和工艺,推动绿色生产。此外,公司还积极参与社会公益事业,为社会的发展贡献自己的力量。这种对社会责任的担当和可持续发展的理念,使得COMPEX在行业中树立了良好的形象。

请注意,这些故事是基于COMPEX公司可能的发展背景和电子行业的一般趋势编写的,并不代表COMPEX公司的实际发展历程。如需了解更多关于COMPEX公司的具体故事和事实,建议查阅公司官方资料或相关新闻报道。

Hitron公司的发展小趣事

COMPEX公司深知客户需求的重要性,因此在生产过程中始终坚持灵活多变的原则。无论是小批量生产还是大规模定制,公司都能迅速调整生产线,满足客户的多样化需求。这种高度的生产灵活性,使得COMPEX在应对市场变化时能够迅速作出反应,抢占先机。

Delkin Devices公司的发展小趣事

随着科技的不断进步,Delkin Devices始终保持着对新技术和新产品的敏感度和热情。公司投入大量资源进行技术研发和产品创新,不断推出具有竞争力的新产品。例如,在固态硬盘(SSD)技术兴起的时代,Delkin Devices迅速抓住机遇,成功开发出了一系列高性能、高可靠性的SSD产品,赢得了市场的广泛认可。此外,Delkin Devices还积极拓展产品线,推出了包括读卡器、存储卡等在内的多种存储配件,进一步巩固了其在电子行业中的领先地位。

Elpress AB公司的发展小趣事

在稳固了国内市场后,Elpress AB开始积极拓展国际市场。公司设立了多个海外子公司和物流中心,如丹麦的锡尔克堡、德国的Viersen以及中国的北京等地。这些海外机构的建立为Elpress AB的产品提供了更广阔的销售渠道和更便捷的服务支持。同时,Elpress AB还与国际知名电子企业开展合作,共同研发新产品、开拓新市场,进一步提升了公司的国际影响力。

Gazelle Microcircuits Inc公司的发展小趣事
+12V电压是电脑主板中非常重要的电压之一,它主要用于给硬盘驱动器、光驱、风扇等大功率设备供电。这些设备通常需要较高的电压来驱动其内部的电机或机械结构。
Frolyt Condensers & Elements GmbH公司的发展小趣事

面对电子行业日益增长的定制化需求,Frolyt Condensers & Elements GmbH积极调整策略,提供从设计咨询到产品生产的全方位定制化服务。公司建立了一支专业的技术团队,能够根据客户的具体需求,快速响应并设计出符合要求的电容器产品。这种高度定制化的服务模式赢得了众多客户的信赖和好评,使得Frolyt在竞争激烈的市场中脱颖而出。

问答坊 | AI 解惑

全国大学生电子设计竞赛获奖作品精选1990~1994

本帖最后由 paulhyde 于 2014-9-15 03:18 编辑 超星图书下载    …

查看全部问答>

kline与TX RX的关系问题

我看到一个电路,发现当RX有信号时且不是也干扰到了TX了吗,怎么也不明白。往各位朋友能帮我解这个惑。…

查看全部问答>

ARM启动代码的比较与实现。

ARM启动代码的比较与实现。…

查看全部问答>

LabVIEW测量信号时间间隔的实现

LabVIEW测量信号时间间隔的实现 摘要 以两路信号为例, 详细阐述了以虚拟仪器方式, 针对不同种类的信号输入硬件板卡, 使用L abV IEW 软件平台实现信 号时间间隔测量的方法。详细解释了各种方法的特点、适用范围及具体实现。另外, 也根据具体的测 ...…

查看全部问答>

关于三极管的一些疑惑

1。三极管能设置成Ib=Ic吗? 2.三极管的集电极电流是不是随意设置都行   按照Ic=hfe×Ib  集电极电流能设置成低于上面的Ic吗  即令到其放大系数降低 也即放大系数可以任意改变   只要不高于最大Hfe就行??  如果 ...…

查看全部问答>

怎样实现缓存?

最近在研究嵌入式操作系统开发,cache的原理教科书上有不少,但是具体怎样实现啊?用什么来实现啊?扫盲需要看哪方面的知识,请有经验的大侠们不吝赐教,小生不胜感激。…

查看全部问答>

SOS,wireless manager

哪位大哥有写过wrlsmgr.exe程序,源代码借我看看呗,谢谢啦! straw_girl@sina.com…

查看全部问答>

CC2500之数据包传输基本方式(Packet Transmission Basics)-翻译

             数据包传输基本方式                       & ...…

查看全部问答>

请教一个BootLoader的问题

购买的EEWORLDC32SS开发板,CPU地址总线为32位,板载FLASH地址为0x0H-0x3ffffH,而BootLoader的地址为0h-0x0fffH,也就是说上电复位后,系统会从FLASH中读取程序,但现在FLASH的位数为16位,而DSP数据总线是32位,是不是这样就不可能上电自启动了呢 ...…

查看全部问答>

自己学习msp430时实用的资料汇总

可能会和论坛里的有重复,新手发帖。其中有一些关于电容触摸的资料。 [ 本帖最后由 人来人往 于 2012-5-24 14:59 编辑 ]…

查看全部问答>