历史上的今天
返回首页

历史上的今天

今天是:2025年03月15日(星期六)

2019年03月15日 | 面部识别隐私安全问题爆发,IBM拿面部数据集赚钱?

2019-03-15

近些年来,面部识别技术得到了长足发展,除了帮你解锁 iPhone,还能让执法机关在人山人海中“一眼”就认出犯罪分子,商店甚至用它来识别自己的“死忠”客户。不过,法律专家却警告称,大量未经允许滥用网络照片最终会画地为牢,反过来成为监控你的“帮凶”。

现在的面部识别技术还不完美,它工作时靠的是算法,目标则很简单——认出那张独一无二的脸。

想把这个任务完成好,技术人员就必须提前“喂给”算法“养料”,即天量的面部照片。那么这些照片从哪来呢?当然是互联网。

起初,算法学习的照片都会按照不同的标准进行分类,比如年龄、性别、肤色等,但经过一段时间的学习后,它的能力开始变得有些吓人了,于是法律和人权专家开始大声疾呼,他们担心技术人员对普通人照片的滥用会带来“反噬”效果。

“这是 AI 训练数据集背后的肮脏小秘密。技术人员可不管三七二十一,只要能用的照片他们都不放过。”纽约大学法学院教授 Jason Schultz 说道。

最近 IBM 公司也进了“暴风圈”,今年 1 月它们向研究人员分享了自己的数据集,包含了 Flickr 上近 100 万张照片,虽然 IBM 号称此举是为了减少面部识别的偏差。

了解真相后的摄影师们不愿意了,因为 IBM 在他们的作品上加了各种细节注释,包括面部几何结构、肤色等信息,而这些照片最终可能会成为面部识别算法的“养料”。

“我拍过的人可没想过,自己的照片居然会被用在面部识别算法训练上。”公关经理 Greg Peverill-Conti 气愤地说道,他有 700 多张照片被收录在了 IBM 的“训练数据集”中。“IBM 太草率了吧,它们怎么能不经同意就使用这些照片”。

IBM 公司 AI 研究主管 John Smith 则表示,公司“致力于保护个人隐私”,如果谁想从数据集中移除照片,尽管联系 IBM。

虽然 IBM 信誓旦旦的保证 Flickr 用户可以随时移除数据集中的照片,但事情哪有那么简单,这本就是个有来无回的“不归路”。因为 IBM 需要拍摄者发送想要移除图片的链接(光靠 Flickr 账号不管用),而它们却从没分享过到底这个数据集用了谁的 Flickr 照片,所以你大概率会被蒙在鼓里。

对于这个数据集,IBM 有自己冠冕堂皇的理由——它将用于学术工作,且担负着让面部识别变得更加公平的重任。当然,在网络照片滥用方面,IBM 并不是独一家,数十家其他研究机构或公司也在采集网络照片训练自己的面部识别系统。

一些法律专家认为,这不仅仅是对数百万人肖像权和隐私权的侵犯,它还加重了人们对面部识别技术的担忧,也许有一天执法部门会让它“双手沾满鲜血”。

面部识别技术的进化历程

面部识别工具刚刚诞生时,研究人员会付钱请人来试验室“帮忙“,这些人拿钱办事,将自己不同姿态和光照角度下的照片留了下来以供研究之用。不过,这样的方案成本高还浪费时间,因此早期的数据集往往只有数百个样本。

进入新世纪后,互联网飞速发展,研究人员突然意识到,面部识别的好时光来了,因为网上有天量的照片可供使用。

056ednc20190314

“直接打开搜索引擎,输入名人的姓名,然后下载各种 360 度无死角的照片既可。”美国国家标准技术局数据集采集人员 P. Jonathon Phillips 说道。

随着社交网络的兴盛和自媒体的发展,普通人的照片也突然多了起来。研究人员默认这些照片是对所有人开放的,有时他们甚至会从 YouTube 的视频中抓取面部图片。

由于工作的非经营性质,学术人员用起照片来绝对是近水楼台,因为他们能绕过版权问题了,而 Flickr 的性质更是让它们成了研究人员绝对的安全之选。

为了保证数据集的多样性,IBM 其实从 Flickr 上 Down 了超过 1 亿张照片,随后又精选了 100 万张有注释的面部照片。为了力求精确,它们甚至为这些照片定了 200 多种分类标准。

057ednc20190314

谷歌学术指出,这种研究方法在业内几乎已经是尽人皆知,因为有数百篇学术论文都在靠照片采集来佐证自己的论点,没人敢说自己是完全清白的,或者拿到了授权或同意。因此,面部识别准确性的提高和分析工具的进步主要就是靠这些“野路子”来的照片。

IBM 真没拿面部数据集赚钱?

“要想让面部识别系统超常发挥,训练数据必须足够多样化,而且覆盖范围足够广。”IBM 的 John Smith 说道。

在 IBM 看来,自己的数据集并未将图片中的人脸和具体的名字联系起来,这就意味着系统不会侵犯人们的隐私。不过,依然有人质疑 IBM 的动机,因为它们可是向政府出售过监控工具。

举例来说,911 袭击发生后,IBM 就将面部识别技术卖给了纽约警方,执法部门通过搜索监控录像就能识别出特殊的肤色或发色。IBM 还曾推出过“智能视频分析”产品,它们能通过监控摄像头给人们加标签(亚裔、黑人或白人)。

如今,IBM 则有了 Waston 视觉识别系统,通过图片算法就能识别出人的年龄和性别。配合正确的训练算法,客户就能从图片或视频中识别出特定的人。在被问到 Waston 用了什么训练数据时,IBM 称数据有多个来源,不过却拒绝披露具体的数据来源,并美其名曰保护知识产权。

一再逼问下,IBM 称从 Flickr 拿到的相片数据集仅用于研究,不会用来提升公司的商用面部识别工具。不过,有专家指出,类似 IBM 和 Facebook 这样的公司,其研发和商业运营部门之间的界限非常模糊,而且研发部门的知识产权均归 IBM 所有。因此,面部识别公司 Kairos 前 CEO Brian Brackeen 断言,即使学术部门研发的算法有其非商业化性质,这些算法最终还是会被拿来赚钱。

他还打了个形象的比喻,“你可以把它看做拿面部识别技术洗钱,公司将网上的照片洗成了自己的知识产权。”

“被选中”的摄影师们怎么想?

澳大利亚摄影师 Georg Holzer 将自己的作品上传 Flickr 是为了记录自己声明中的精彩瞬间,他也签署了创意认证,只要是非营利性项目,就能免费使用他的照片。不过,他没想到自己的照片会成为面部识别技术的“养料”。

“我了解技术能造成的伤害。”Holzer 说道。“当然,面部识别技术也有其积极的一面,但如果用得不对,它也能剥夺人的基本权利和隐私。我是无法接受这项技术广泛应用的。”

“我觉得 IBM 可不是家慈善公司,最终它们还是会用这项技术牟利,所以面部识别技术还是会进入商业市场。”Holzer 说道。

Dolan Halbrook 也有 452 张照片被 IBM 的数据集“侵吞”,他也认为 IBM 在使用这些照片时应该征得自己的同意。

当然,也有摄影师觉得自己的照片能被 IBM 选中并用在推动面部识别发展上是一大幸事。

瑞士的 Guillaume Boppe 就表示:“如果我的照片能帮助 AI 进化,降低探测错误率并最终提升全球安全指数,我举双手赞同。”

想从数据集中删图?没那么容易

如果你不同意 IBM 将自己的照片当成训练数据,也可以联系它们删除,但操作起来没那么容易。一位被抓取 1000 多张照片的摄影师忙活了半天,也只删除了 4 张照片,因为他无法找到所有照片的链接,而 Flickr 账号 IBM 可不认。

此外,即使从 IBM 的数据集中删除了照片,IBM 研究伙伴拿到的数据集也无法一并删除(已经有 250 多家组织和机构接入了 IBM 的数据集)。

显然,IBM 的数据集不是公共场所,没法想来就来想走就走。

好在,各国对隐私数据的保护正在加强。举例来说,欧洲就将照片看做“敏感个人数据”,如果 IBM 不按规定删图,可能就会被欧盟重罚。在美国,也有一些州有了相关规定,在不征得当事人同意的情况下采集、存储和分享生物信息属违法行为,而生物信息包含指纹、虹膜和面部几何结构等。

近期,芝加哥的律师 Jay Edelson 就向 Facebook 发起了集体诉讼,称其面部识别工具触犯了相关法律。

至于典型的法院判例,现在还是一片空白。


推荐阅读

史海拾趣

台湾富致(FUZETEC)公司的发展小趣事

Futaba Electric最初起源于收音机收讯真空管的制造,但在1970年,公司做出了重大的战略调整,决定结束真空管业务,专注于萤光表示管(VFD)的生产。这一决策标志着公司从传统电子元件向高级显示技术的转型。随着VFD技术的不断发展,Futaba凭借其在清晰度、视角和亮度方面的卓越表现,逐渐在全球VFD市场中占据领先地位,目前市场份额超过60%。这一转型不仅使Futaba成为VFD技术的领导者,还为其在汽车仪表盘和抬头显示器等领域的广泛应用奠定了基础。

CONTRINEX公司的发展小趣事

在数控加工领域,Contrinex的数字测量智能传感器带来了革命性的变革。这些先进的传感器能够精确实时地测量拉杆位置,通过智能决策,确保加工精度,防止潜在损坏。其卓越的性能和稳定性,使得Contrinex在这一领域取得了显著的成绩,并赢得了众多客户的赞誉。

Alliance Memory公司的发展小趣事

除了上述重要事件外,Contrinex还一直致力于产品创新和技术研发。多年来,公司不断推出新型传感器产品,如防磁防焊型电感式传感器、扩展型纤细型安全光幕等,以满足不同客户的需求。同时,Contrinex还积极与OEM和系统集成商合作,共同开发定制化解决方案,为客户提供更加全面和专业的服务。

这些故事只是Contrinex在电子行业发展历程中的一部分。作为一个不断追求卓越和创新的企业,Contrinex将继续致力于为客户提供高品质、高精度的传感器产品和解决方案,推动电子行业的持续发展。

Crystek公司的发展小趣事

Crystek公司成立于1958年,自创立之初,就致力于成为射频微波和频率控制行业的高性能技术领导者。创业初期,Crystek公司凭借其敏锐的市场洞察力和前瞻性的技术视野,成功开发了一系列高质量的频率产品,包括石英晶振、时钟振荡器(XO)等,逐渐在市场中树立起了良好的口碑。通过不断的努力和创新,Crystek公司逐渐在电子行业中崭露头角,赢得了客户的信任和认可。

Artesyn Embedded Technologies公司的发展小趣事

随着公司产品的不断完善和市场认可度的提高,Artesyn Embedded Technologies开始与全球众多科技大厂建立紧密的合作关系。这些大厂包括知名的通信设备制造商、数据中心运营商等。通过与这些大厂的合作,Artesyn的产品得以广泛应用于各个领域,进一步提升了公司的知名度和影响力。

BELLING LEE公司的发展小趣事

在激烈的市场竞争中,BELLING LEE公司始终坚持品质至上的原则。公司从原材料采购、生产制造到售后服务都严格把关,确保每一款产品都能达到高品质标准。这种对品质的执着追求赢得了客户的信任和好评,也为公司赢得了良好的口碑和品牌形象。

问答坊 | AI 解惑

I2C 总线规范中文资料下载

本帖最后由 jameswangsynnex 于 2015-3-3 20:01 编辑 非常翔实、全面的四篇文档,没有比这更详细的。好好阅读,一切尽在掌握! 几乎在所有的总线接口中,最重要的参数就是时序。对于初学者,不应仅满足于器件的连接和编程。需要掌握总线接口时序 ...…

查看全部问答>

基于AVR单片机的通用USB接口模块设计

1 引言 USB接口以其数据传输快、连接简单、易于扩展、支持热插拔等特点已成为外设与PC通信的主要方式之一。随着嵌入式系统的发展,嵌入式微处理器需增加通用的USB接口,以便实现与PC等USB主机系统的通信。针对这样的需求,这里采用PHILIPS公司的USB ...…

查看全部问答>

TI开展MSP430开发版免费申请活动了,赶快参加吧

  只需到TI的网站填写调查问卷,就有机会获得免费的MSP430开发板,赶快行动吧     能以 8 位产品价格实现 16 位出色性能与超低功耗的 Value Line 系列 MSP430™ 处理器,可帮助您轻松启动设计,真正做到以更少投 ...…

查看全部问答>

请问从事硬件设计(非电子设计,就是主要不是搞vlsi),应该有什么样的基础,请详细说明

我是一个初学者,我的师兄在大唐电信工作  他本科是学计算机科学与技术的 他研究生学习的是计算机控制技术   他做过汽车电子的项目 他做过嵌入式系统 他很忙 联系不上他 所以问大家 作为硬件工程师  需要那些 ...…

查看全部问答>

keilde 问题

这是一个8*8led的扫描程序,用keil时新建保存了,在新建工程后引入,编译,就提示这个了 “文件被外部编译器改变,是否重新载入” 显示错误是 “创建目标 \'目标 1\' PA51汇编 STARTUP.A51 ... PA51汇编 saomiao.asm ... 连接 ... BL51 BANK ...…

查看全部问答>

wince下透明按钮问题(附源码)

各位路过的,驻留的,寻找解决方案的大佬们儿,哪位来帮小弟我看看我的代码是哪出问题了。小弟感激不尽!奉送小弟所有可用分做为感谢! 同的代码在MFC下显示是正常的,但在wince下按钮那块就好像被抠空了,直接显示程序启动时的桌面。…

查看全部问答>

从pc到pda

我用evc4.0, ppc2003SDk写了一个应用程序,其中用到了MFC和别的公司的dll.现在我想把这个程序导到pda掌上电脑上来运行.因为刚接触pda上的开发,软硬件知识也较差,所以产生许多疑问: 1. 购买pda时要注意些什么才能保证程序可以在上面运行? 比如我看到 ...…

查看全部问答>

新手请教:VC到EVC移植的数据类型及函数问题

各位大侠好:   我是一个刚参加工作的学生,得到的任务是将一个VC6.0写好的库移植到EVC上面。我使用的方法是将VC的代码粘贴到EVC中,再Bulid找错误,不知道是不是对。   在找错误期间,首先遇到了 error C2664: \'localtime ...…

查看全部问答>

PL通过RS485连接两台触摸屏方法

任意一台带RS485口输出的PLC,使用同一端口连接两台触摸屏,如何实现?   现在的触摸屏都有“多屏一机”的功能,一台触摸屏做主机,另一台做从机。 主触摸屏一个485口连接PLC,主触摸屏再用以太网口或者串口连接另一台从触摸屏。一般触摸屏 ...…

查看全部问答>