历史上的今天
返回首页

历史上的今天

今天是:2025年07月09日(星期三)

正在发生

2018年07月09日 | “暗黑版”AI现身引忧虑——我们需要怎样的人工智能

2018-07-09 来源:中国科技网

近日,麻省理工学院媒体实验室出品了一个“暗黑版AI”,再次将人工智能的黑箱隐忧这个经久不衰的话题送上热门。据报道,实验室的三人团队联手创造了一个叫诺曼(Norman)的人工智能,与希区柯克经典电影《惊魂记》中的变态旅馆老板诺曼·贝兹同名。

名如其人。诺曼会以负面想法来理解它看到的图片。例如,一张在一般AI看来只是“树枝上的一群鸟”的普通图片,在诺曼眼中却是“一名男子触电致死”。

团队希望通过诺曼的表现提醒世人:用来教导或训练机器学习算法的数据,会对AI的行为造成显著影响。AI会成为什么样,有时人类可能束手无策。

TA们的偏见就是人类的偏见

诺曼们从哪来?答案首先藏在数据里。

“人工智能识别出的结果不是凭空而来,是大量训练的结果。如果要训练AI某一方面的能力,比如下棋,就需要收集、清洗、标记大量数据供机器学习。如果用于训练的数据不够多,就会造成AI学习的不充分,导致其识别结果的失误。”中科院自动化研究所研究员王金桥对科技日报记者表示。数据本身的分布特性,如偏差甚至偏见,也会被机器“有样学样”。针对诺曼的表现,创造它的实验室也指出,“当人们谈论人工智能算法存在偏差和不公平时,罪魁祸首往往不是算法本身,而是带有偏差、偏见的数据。因为当前的深度学习方法依赖大量的训练样本,网络识别的特性是由样本本身的特性所决定。尽管在训练模型时使用同样的方法,但使用了错误或正确的数据集,就会在图像中看到非常不一样的东西”。

另外是算法本身的影响。“这可能是无法完全避免的,由深度学习算法本身的缺陷决定,它存在内在对抗性。”王金桥表示,目前最流行的神经网络不同于人脑的生物计算,模型由数据驱动,和人类的认知不具有一致性。基于深度学习的框架,必须通过当前训练数据拟合到目标函数。在这个框架之下,如果机器要识别狗,它会通过狗的眼睛、鼻子、耳朵等局部特征进行可视化识别,而这些可视化特征却能给想利用深度学习漏洞的人机会,后者可以通过伪造数据来欺骗机器。

除了人训练机器的数据本身有偏差以外,机器通过对抗性神经网络合成的数据也可能有问题。由于机器不可能“见过”所有东西(比如识别桌子,机器不可能学习所有长短宽窄各异的桌子),人也不可能标记所有数据。如果研究者输入一个随机的噪音,机器可以向任何方向学习。这是一把双刃剑,机器也可能合成一些有问题的数据,学习时间长了,机器就“跑偏”了。

数据的均衡或可减少“跑偏”

不少科学家以“garbage in, garbage out”来形容“数据和人工智能的关系”。中科视拓(北京)科技有限公司CEO刘昕说:“对机器学习而言,进什么就出什么。监督学习就是让模型拟合标签,比如训练者把帅哥都标记成‘渣男’,那么机器看到刘德华,就会认为他是……”谈到诺曼引发的讨论,刘昕表示:“不需要担心,人类本身就有各种歧视和偏见,用人类生产的数据训练AI,再批判AI不够正直良善,这么说有点危言耸听。”

偏见、刻板印象、歧视都是人类社会的痼疾,有些流于表面,有些深入社会肌理,无法轻易剥离。在这样的语境中产生的数据,携带着大量复杂、难以界定、泥沙俱下的观点。如果研究者没有意识到或着手处理这一问题,机器学习的偏见几乎无解。真正的“公正算法”或许是不存在的。

据有关媒体报道,在谷歌研究自然语言处理的科学家 Daphne Luong 表示,正确地校准标签对机器学习来说非常关键,有些数据集其实并不平衡,像维基百科上的数据,“他”(He)出现的次数远比“她”(She)要多。

王金桥也着重强调了“数据的均衡”。就算对人来说,不同人秉持着不同的价值观,但多听多看多受教育可以让人向良好的方向改进。机器学习也是如此。“训练机器时,要注重数据的均衡,给它更多可靠的数据。研究团队成员具有多元的学术背景(如吸纳更多社会学、心理学等领域学者加入)、性别、年龄、价值观,也可以帮助机器学习更加均衡,减少机器出现偏见、谬误甚至失控的可能。”王金桥说。

“机器学习的模型本身也要有一定的防攻击能力,从技术上防止本身结构设计的漏洞被攻击,研究者可以使用各种数据攻击机器,训练机器的反攻击能力。”王金桥说。

作恶还是向善,是人类的选择

1942年,阿西莫夫在短篇小说《环舞》中首次提出著名的机器人三定律:机器人不得伤害人类,或因不作为使人类受到伤害;除非违背第一定律,机器人必须服从人类的命令;除非违背第一及第二定律,机器人必须保护自己。半个多世纪过去,人工智能在大数据的加持下迎来爆发式发展。某些专用型人工智能把人类智能甩在身后,人们开始担忧,机器伤害人类的那一天是不是不远了。

因此有一种看法很主流——人类训练有意识、有自我觉知的人工智能是不明智的。开个脑洞,机器一旦发展出自我意识,要反向攻击人类,场面或许失控。

前段时间,据路透社报道,韩国科学技术院的人工智能研发中心正在研发适用于作战指挥、目标追踪和无人水下交通等领域的人工智能技术,希望在今年年底前研发出基于人工智能的导弹、潜艇和四轴飞行器。此事引发学术界的巨大震动,抗议纷至沓来,并最终以院长保证无意于“杀手机器人”的研发并重申人类尊严和伦理收场。在美国,以“不作恶”为纲的谷歌也因与国防部的合作协议涉及“Maven项目”被推上风口浪尖,反对者普遍认为,识别结果完全有可能被用于军事用途,比如说精准打击。谷歌最终表示终结协议。

相较于舆论环境的忧心忡忡,研究者对“技术向善”普遍乐观。他们认为把AI和“杀人机器”联系在一起,近乎“捧杀”,夸大AI能力之余,也引发不明真相的公众恐慌,无益于人工智能的发展环境。

“很多人提到AI总是一惊一乍,把AI说成超人。我相信人工智能是能解决问题的,但大家的期待也要在合理范围内。人和机器各有优势,技术会服务于特定场景,但也不需要把AI捧上天。”接受科技日报记者采访时,思必驰北京研发院院长初敏博士忍不住“抱怨”了一下。看来“我们需要怎样的AI”这一题,大家都还没有答案。

推荐阅读

史海拾趣

Eureka Microelectronics Inc公司的发展小趣事

Eureka公司自1995年成立以来,一直致力于电子技术的研发和创新。在早期阶段,公司凭借一款具有创新性的液晶显示驱动IC产品,成功打入市场。随着技术的不断进步,Eureka逐步拓展了产品线,推出了包括类比-数位混合信号处理器、系统应用完整方案等一系列产品。这些产品的推出,不仅丰富了Eureka的产品线,也提升了公司在行业内的竞争力。

GD Rectifiers Ltd公司的发展小趣事

面对电子行业日益激烈的市场竞争,GD Rectifiers Ltd通过并购整合的方式加速了自身的发展步伐。公司精心挑选了几家在细分领域具有领先地位的竞争对手,通过友好协商和合理估值,成功完成了对这些企业的并购。并购后,GD Rectifiers Ltd充分利用被并购企业的技术优势和市场份额,实现了产品线的进一步丰富和销售渠道的拓展。同时,公司还加强了对内部资源的整合和优化,提高了整体运营效率和市场竞争力。

喜美克斯(Cvilux)公司的发展小趣事

喜美克斯公司深知人才是企业发展的核心动力。因此,他们高度重视人才的引进和培养。公司建立了一套完善的人才选拔和培养机制,通过内部培训、外部引进等多种方式,不断为公司注入新鲜血液。同时,公司还为员工提供广阔的职业发展空间和优厚的福利待遇,激发了员工的工作热情和创造力。这些举措为喜美克斯公司的长期发展提供了坚实的人才保障。

CIF公司的发展小趣事

D公司始终坚持品质至上的经营理念,以提供高品质的电子产品为己任。在CIF交易模式下,D公司严格控制产品质量,从原材料采购到生产流程中的每一个环节都进行严格把关。凭借出色的产品质量和良好的售后服务,D公司赢得了客户的信任和好评。

Herley New York公司的发展小趣事

A公司是一家专注于电子元器件生产的CIF公司。在成立初期,A公司凭借其创新的研发能力和高效的生产流程,迅速在市场中脱颖而出。通过与全球多家知名电子产品制造商建立稳定的CIF贸易关系,A公司不断扩大生产规模,优化产品质量,逐渐发展成为行业内的领军企业。

ADATA公司的发展小趣事

B公司原本是一家地区性的电子产品供应商,为了拓展国际市场,决定采用CIF交易模式。通过与国外客户的深入沟通和合作,B公司成功打开了多个海外市场。同时,B公司还积极参与国际电子产品展会,提升品牌知名度,进一步巩固了其在全球市场的地位。

问答坊 | AI 解惑

求EVC开发周立功ARM10的串口通讯问题

我需要用周立功ARM10开发平台操作伺服电动机,目前采用串口控制电动机方式,现在通过串口发出去的东西,不能控制电动机。程序已经发出去,请高手帮忙,需要微软EVC环境。太感谢了,老总和客户催催催,我头都大了,搞不定,请求帮助,请高手帮忙解决 ...…

查看全部问答>

求学驱动编程经典书籍

上大学1.5年了,会点C,会点C++,会点JAVA,才过了个scjp认证,对学习逐渐迷茫了.. 听说市场比较缺乏编写驱动的程序员.. 各位大虾帮偶指教下…

查看全部问答>

求教CJ2672耐压测试仪

CJ2672耐压测试仪如何使用??? 有用过的能介绍一下吗,仪器上各个按钮是做什么用的,怎么用?哪里要是有视频的话就更好了 …

查看全部问答>

寻有无线条码数据终端Symbol PDT8146编程经验的高手

想做一个固定资产清查软件: 通过无线终端可以实现对粘有条码的设备进行清查,并能够与服务器数据进行互连 PC端的程序不需要实现,只要实现无线终端查询和报表功能.请有兴趣的朋友与我联系,有偿服务 QQ 30107562 暗号 无线终端…

查看全部问答>

一个关于ADS的问题?

在使用ADS Debug uC/OS系统和一个简单的让蜂鸣器响的应用程序时,AXD loading image后,没有进入StartUP函数而是进入Disassembly,Go后不停的running image ,蜂鸣器不响,也不知道是不是下到板子里了。 请问是怎么回事?…

查看全部问答>

我就不说瑞萨单片机有四个PWM。。。。

本帖最后由 paulhyde 于 2014-9-15 03:09 编辑 而且硬件I2C。。。。。而且有俩UART。。。。而且有乘法器。。。运算还可以。。。。    …

查看全部问答>

半导体、IC生产线上的静电危害

     ①静电库仑力的危害:静电库仑力作用下吸附的粉尘、污物,可能带给元器件,从而增大泄露或造成短路,使性能受损,成品率大大下降。如粉尘粒径>100微米,铝线宽度约100微米,薄膜厚度在50微米以下时,最易使产品报废,这种情形多发 ...…

查看全部问答>

貌似CCSv6的串口控制台爆BUG了.

官方例程都毫无显示,波特率各种参数都是对的,不知道大家是不是这样的呢.[串口工具在Windows - Show View - Other - Terminal - Terminal] …

查看全部问答>

方波经带通滤波器后为什么产生振铃?

信号发生器产生的是50HZ的方波,带通滤波器的中心频率为2K,幅频特性如下图所示: 运放的输出端会产生如下的振铃: 产生这个现象的原因是什么呢?类似于信号完整性里的振铃吗? 如何消除? 求高手解惑呀,谢谢! …

查看全部问答>

用ATmel Studio6.2编译出错,ATmega16的T/C0例程

我最近在学习AVR单片机,我参考《AVR单片机使用C语言程序设计与典型实例》书上的例程来学习,但是我使用Atmel Studio6.2编译书上的T/C0例程时,出错了,是什么原因呢? #define F_CPU 4000000UL #include //#include #include #include #define ...…

查看全部问答>