历史上的今天
返回首页

历史上的今天

今天是:2024年11月25日(星期一)

正在发生

2019年11月25日 | AI正学会所有偏见!算法偏见更难辨认也更持久

2019-11-25 来源:DeepTech

人工智能学习人类知识,同时也吸收人类偏见。这种担忧由来已久。但谷歌的一项新发明极大推进了人工智能从文本材料中学习的速度,也使解决机器偏见问题迫在眉睫。

 

10 月 25 日,谷歌宣布利用 BERT 来优化搜索引擎,已经使英语搜索结果的匹配度提高了 10% 左右。未来,谷歌还会推出学习其他语言和国家的算法。

 

BERT 是谷歌在 2018 年开发的一种基于神经网络的 NLP 技术,它能一次接收整句话,而非从左至右(或相反)逐字接收。这使得如果有人要搜“在没有路缘的山坡停车”,BERT 能认出“不要”,从而给出正确的搜索结果。而传统搜索引起只会关注“路缘”和“山坡”,给出与搜索意图相反的结果。

 

图 | BERT 能更好识别“在没有路缘的山坡停车”句子里的“没有”一词,从而理解人类意图(来源:https://blog.google)

 

让人们担忧的是,BERT 的学习材料正来自数字化书籍和新闻文章。在 BERT 学会一切之前,人们没有时间来清理其中根深蒂固的偏见。而这些偏见一旦被算法吸收,将更难辨认,也更难清除。

 

“形象一下在 AI 世界长大的孩子。他们在谷歌搜索 CEO 照片,冒出的大部分是男性。他们又搜索个人助手,大部分是女性。”Kriti Sharma 在一次 TED 相关演讲中说。卡耐基梅隆大学的计算机科学家已研究证实,BERT 倾向于将程序员与男性联系起来。

 

另一位计算机科学家 Robert Munro 发现,展示给 BERT 100 个单词,包含马、婴儿、房子、珠宝等。BERT 会认为大部分与男性有关,仅妈妈是个例外。

 

“BERT 改变了一切,你可以教它所有技巧。”NLP 初创公司 Primer 的科学主管 John Bohannon 说。Munro 则认为,不平等现象一直存在,但有了 BERT,偏见就能够继续存在下去。

 

“是时候把算法当作人类设计的造物了。”人工智能批评人士 Kate Crawford 说,算法经常被看作是不带偏见、不可理解、勿需质疑的对象,但实际它会继承我们的偏见,它只可能跟我们一样好。

 

 

决策黑盒为偏见“藏污纳垢”

 

人们最初确实天真地以为,算法能比人类更能避免偏见。1970 年代,伦敦圣乔治医学院的 Geoffrey Franglen 博士着手编写一个算法来筛选学生的入学申请。他认为,如果所有学生的申请都要遵循完全一样的评估流程,结果就是公平的。

 

算法完成后与人类判断有 90% 到 95% 的一致率,因此被投入使用。但直到 4 年后,调查者才发现:算法会仅仅因为一个候选人没有欧洲名字(可能不是白人),就扣除 15 分。如果申请者是女性,又要被扣掉 3 分。

 

“从深层次看,算法只是在维持招生系统早已存在的偏见而已。”IEEE 的文章评论说,“圣乔治医学院之所以被逮住,是因为他们把偏见供奉到一个计算机程序里面,歧视是调查者可以验证的。”

 

但对于人工智能的黑箱式决策,情况变得更加复杂。性别或出生地在算法中并不对应单一可辨的参数,你很难给机器“定罪”。“在大工业时代,机器以暴露齿轮来展示强大。但如今,齿轮被隐藏起来,融入生活,无处不在,AI 就是这个齿轮。”一篇《福布斯》文章精辟地说。

 

在这种黑箱决策面前,反歧视法案可能也无能为力。Kriti Sharma 认为,如果 AI 帮人事主管寻找一位技术领袖,它会发现主管雇佣的大多是男性,从而以为男人比女人更容易编程。如果人类主管这样做,我们会愤怒,也能够阻止。“人工智能实际已凌驾于法律之上,因为是机器做的决定。”

 

更值得担忧的是,AI 决策可能放大了科技企业和数据标注者的权力,因为无人能监督。一个名为 ImageNet Roulette 的流行应用,曾故意向人们展示这种风险:它曾倾向于将非洲裔美国人标记为“不法分子”“罪犯”,此外还有“失败者”“初学者”“荡妇”这样的标签。

 

图 | ImageNet 展示了为人们打上刻板标签的权力,如何从拿低薪的标注者手中转移到算法上(来源:frieze.com)

 

它的训练数据来自 ImageNet 数据集,包含了 1400 张被标记的照片,而每张标记费用为几美分。因此标签标注者的偏见便被带入数据集,训练出各种算法,应用在形形色色的领域。“如果标注女性照片的人不选非二元人群或短发女性,那最终得到的人工智能就只认长发的女性模特。”

 

在被发现算法存在机器偏见时,谷歌和亚马逊都会承诺迅速解决。“我们发现的明显的偏见,但里面如果还有几个呢?”Bohannon 博士说。如果要依赖这种决策,“正如生物学家努力理解细胞工作原理一样,软件工程师也必须找到理解 BERT 系统的方法。”

 

人人都要学会讨好算法

 

电影《少数派报告》里,汤姆克鲁斯负责抓捕那些被电脑认为“将要犯罪”的人,直到有一天自己也上了抓捕名单。在现实中,类似的系统可能已经上线。

 

据 BBC 报道,2017 年 5 月,英国达勒姆警方启用了一套系统。它学习过警方 5 年关押报告和 2 年定罪报告,来预测嫌疑人犯罪的可能性是低、中、高,以决定是否收押。

 

但使用数年后,评估工具发现,这套系统认为黑人是罪犯的概率是白人的两倍,还喜欢把白人定为低风险、单独犯案。此外,它预测低风险犯罪的准确率为 98%,高风险为 88%,暗示它宁错抓一千、不错放一人。 

 

2016 年 12 月,迪拜警方也启用了一套系统,来预测不同地区犯罪概率,将警力部署在高风险地区加强巡逻。

 

如果说预测犯罪尚遥远,AI 招聘则掌握了你的生杀大权。11 月初,高盛、希尔顿和联合利华等企业都开始使用一种名为 HireVue 的 AI 视频面试系统,并赞赏有加。希尔顿高管说,HireVue 将招聘周期从 6 周缩短到了 5 天。

 

图 | 学会讨好 HireVue 的算法有望成为求职者的必备技能(来源:softwareadvice.com )

 

但它的决策偏好被发现匪夷所思:AI 分不清你皱眉是因为在思考问题,还是情绪不佳(暗示性格易怒)。面试者既担心表现,又不知 AI 如何给自己打分,以至于刻意迎合 AI:在面试全程表情微笑、放慢语速、在摄像头边贴上眼睛贴纸,以维持眼神接触,以及让背后是一堵白墙,防止干扰算法。

 

此外,HireVue 也被认为加强了求职偏见:机器通过学习现有员工来寻找新员工。这意味着如果一个部门所有员工全是白人(即使是巧合),AI 也会不自觉地偏向寻找白人。如果好员工恰都是女性,那么男性面试者也会被降低权重。 

 

“我们迎来了焦虑的一代,要求他们面向屏幕说话,对摄像头回答问题,还不告诉他们如何做得更好。”辅导学生参加 HireVue 面试后,杜克大学经济学教授 Emma Rasiel 表示。不难想象,如果你能骗过 AI 面试,也许会尝试用匪夷所思的举动骗过其他 AI 决策。

  

参考:

 

https://www.nytimes.com/2019/11/11/technology/artificial-intelligence-bias.html?auth=login-email&login=email

https://www.nytimes.com/2019/09/20/arts/design/imagenet-trevor-paglen-ai-facial-recognition.html?action=click&module=RelatedLinks&pgtype=Article

https://blog.google/products/search/search-language-understanding-bert/

https://www.bbc.com/news/technology-39857645

https://www.ted.com/talks/kriti_sharma_how_to_keep_human_biases_out_of_ai/transcript?language=zh-cn



推荐阅读

史海拾趣

Connective Peripherals Pte Ltd公司的发展小趣事

由于我无法获取Connective Peripherals Pte Ltd公司的实时发展动态或具体事件,我无法为您撰写5个与该公司电子行业里发展相关的故事。然而,我可以为您概括性地描述Connective Peripherals Pte Ltd公司在电子行业中的发展概况,以便您了解该公司的基本情况和行业地位。

Connective Peripherals Pte Ltd自2016年成立以来,在电子行业里逐步崭露头角,成为一家备受瞩目的通信和仪器仪表产品供应商。该公司专注于基于USB、CAN和RS232/RS422/RS485接口的串行连接解决方案,凭借卓越的技术实力和创新能力,在行业中树立了良好的口碑。

随着科技的飞速发展,电子行业对高效、稳定的通信和仪器仪表产品需求日益增长。Connective Peripherals Pte Ltd紧跟行业趋势,不断推出创新产品,满足市场需求。从提供USB到串行接口连接的适配器板和电缆,到开发基于USB的示波器、数据记录器和逻辑分析仪等高端产品,Connective Peripherals Pte Ltd的产品线日益丰富,质量也逐步提升。

在市场竞争激烈的电子行业,Connective Peripherals Pte Ltd凭借其卓越的产品质量和完善的售后服务,赢得了众多客户的信赖和支持。该公司与多家知名企业建立了长期稳定的合作关系,产品远销海内外,为公司的快速发展奠定了坚实的基础。

此外,Connective Peripherals Pte Ltd还注重技术研发和人才培养。公司拥有一支高素质的研发团队,不断投入资金进行技术研发和创新,为公司的持续发展提供了强大的技术支持。同时,公司还积极开展人才培训和引进工作,吸引了一批优秀的行业人才加入公司,为公司的长远发展注入了新的活力。

总之,Connective Peripherals Pte Ltd在电子行业里凭借卓越的技术实力、丰富的产品线和完善的售后服务,逐步发展成为一家具有影响力的企业。未来,随着电子行业的不断发展,Connective Peripherals Pte Ltd有望继续保持其领先地位,为行业的进步和发展做出更大的贡献。

请注意,以上内容仅为概括性的描述,并未涉及具体的故事或事件。如果需要更详细的故事或事件描述,建议查阅相关的行业报告、公司年报或新闻报道,以获取更准确和具体的信息。

CLARE公司的发展小趣事

CLARE公司始终坚持品质至上的原则,从原材料采购到生产制造、质量检测等各个环节都严格把控,确保产品的品质和性能达到客户的期望。同时,公司还建立了完善的售后服务体系,为客户提供及时、专业的技术支持和服务。这些举措赢得了客户的信赖和好评,为CLARE公司的长期发展奠定了坚实的基础。

台湾富晶(FORTUNE)公司的发展小趣事
使用示波器等工具检查时钟信号的波形和频率是否正常。
Dau Semiconductor Inc公司的发展小趣事

在成立初期,Dau Semiconductor Inc公司面临着诸多技术挑战。其中,如何实现芯片的低功耗设计是困扰公司发展的一个难题。为了解决这个问题,公司投入大量研发资源,不断探索新的技术和材料。经过数年的努力,公司终于成功突破了技术瓶颈,研发出了一款具有超低功耗的半导体芯片。这款芯片的推出,不仅为公司赢得了市场认可,也为公司在行业中树立了技术领先的形象。

Good Sky Electric Co Ltd公司的发展小趣事
电气原理图在摇臂钻床维修中起着至关重要的作用。它详细描绘了设备的电气控制系统和元件之间的连接关系,为维修人员提供了准确的故障排查和检修依据。通过仔细阅读和分析电气原理图,维修人员可以迅速定位故障点并采取相应的修复措施,从而缩短维修时间并降低维修成本。
东软载波(EastSoft)公司的发展小趣事

凭借卓越的产品性能和技术实力,东软载波获得了多项荣誉和认证。公司被评为“国家绿色工厂”,多款产品通过国内外权威认证。同时,公司还荣获了多项行业奖项和荣誉称号,如“2022 PLC互联互通·基石奖”、“2022年山东民营企业新一代信息技术行业领军10强”等。这些荣誉的获得充分证明了东软载波在电子行业中的领先地位和实力。

问答坊 | AI 解惑

全志异核多构 AI智能视觉V853开发板测评 - 编译eye-mpp 中的sample_virvi

# 编译eye-mpp middleware 中的sample_virvi例程 ## `make menuconfig`配置sample_virvi ## 使用adb push 命令将sample_virvi 和sample_virvi.conf 复制到板子目录下; ## 修改保存的YUV图像帧数 ## 保存的YUV图像数据存放位置为/mnt/ex ...…

查看全部问答>

ATX电源详解

1.ATX电源有20针和24针两种,黑色地线、橙色3.3V,红色5V,黄色12V。 2.传统的电源开关决定了机器的工作始终,而ATX电源却不是这样,它主要靠+5VSB输出和PS-ON输出来决定电源的开关,通过PS-ON信号的控制,可以通过电压的大小来控制电源。而AT ...…

查看全部问答>

【行空板 Python编程学习主控板】使用屏幕色卡控制WS2812B灯环的控制器

本帖最后由 HonestQiao 于 2022-11-17 23:02 编辑 行空板自带屏幕,而系统自带的Python,还预装了专用开发库unihiker和硬件控制库pinpong,可以让使用者非常方便的控制屏幕,以及快捷的和外部设备交互。 使用pinpong,在行空板上点亮WS2812B ...…

查看全部问答>

LDO芯片选择时如何看PSRR曲线

有人说LDO的PSRR参数对输出电压的纹波及噪声影响很大 那么,选择LDO时如何考虑PSRR参数,还是不用理会呢 还有下面的LDO芯片选择时如何看PSRR曲线   …

查看全部问答>

谁有《印制电路手册:原书第6版·中文修订版》的电子版,能否分享一下?

最近刚加入印制电路板行业,想学习下行业内经典文集。看到有人推荐《印制电路手册:原书第6版·中文修订版》,可惜网上搜不到电子文档,纸质版又太贵买不起。不知哪位大侠可以分享下此书的电子文档? …

查看全部问答>

【创龙科技全志A40i开发板】TL7606I模块测试 (2)

## 前 言 本文主要介绍基于全志科技A40i(ARM Cortex-A7)处理器的8/16通道AD采集开发案例,使用核芯互联CL1606/CL1616AD芯片,亦适用于ADI AD7606/AD7616。CL1606/CL1616与AD7606/AD7616软硬件兼容。 > 备注: > > (1)创龙科技TL760 ...…

查看全部问答>

骇客空间杂志第61期

replyreload += \',\' + 3189847;     Timson,如果您要查看本帖隐藏内容请回复 …

查看全部问答>

「技术」室内定位—AOA测距算法,定位精度可达1m

「技术」室内定位—AOA测距算法,定位精度可达1m: …

查看全部问答>

速锐得适配进口福特烈马BRONCO车载 CAN总线应用随动转向大灯改装

适配进口福特烈马BRONCO车载 CAN总线应用随动转向大灯改装,必须先获得福特烈马BRONCO的原厂电路图纸,为此,速锐得准备了福特诊断仪、福特烈马BRONCO原厂电路图纸工具,适配装置、CAN数据采集设备、软件及线缆等一系列工具。 我们首先OTA升 ...…

查看全部问答>

双极性转换电路multisim仿真不成功的问题

双极性转换电路multisim仿真不成功的问题 multisim仿真文件没有实现图片的功能,波形显示不正确,是哪里设置不对?   …

查看全部问答>