历史上的今天
返回首页

历史上的今天

今天是:2025年02月18日(星期二)

正在发生

2019年02月18日 | IBM AI与人类辩论赛:机器语义、逻辑分析能力突飞猛进

2019-02-18 来源:潜望

你或许从来没有见过这样一场奇特的辩论赛:人类辩手在讲台上正进行着精彩陈述,一旁是一台一人多高的黑色方形柱,中间屏幕上的三个光球不时弹跳、闪烁,随后,从这台柱子身上传出一个冷静的女声,保持着恒定的语速阐述自己的观点。


这场备受瞩目的人与人工智能之间的辩论赛11日在IBM 2019年Think大会期间上演。台上的黑色柱子,是被IBM称为“Project Debater”的人工智能系统,诞生于IBM位于以色列海法的实验室,最早于2011年由研究员Noam Slonim提出,去年6月,Project Debater首次在旧金山的一场媒体闭门活动上亮相,对阵两名以色列辩论冠军并取得胜利。


f时隔半年多后,Project Debater的再次亮相则高调了许多,这场辩论赛对外进行了视频直播,对阵的人类辩方是2012年欧洲辩论冠军、入选2016年全球辩论大赛最终决赛圈的专业辩论选手Harish Natarajan。


当天的辩论赛分成三部分进行,首先正反双方分别进行4分钟的观点陈述,然后进入各自4分钟的反驳时间,最后是各自进行2分钟的总结。


这场辩论的辩题为“是否应该对学前教育进行补贴?” Project Debater 为正方,人类辩手为反方,每一轮都由Project Debater首先进行。


在开场陈述中,Project Debater表示,应该对学前教育进行补贴,“补贴”不仅仅是“钱”的问题,还关乎政治、社会和伦理道德等,根据许多过往的经验及研究表明,学前教育能够对社会带来正效益,包括减少犯罪,帮助贫困等,Project Debater特别提到帮助贫困人群的问题,相关研究成果称,学前教育可以帮助与贫困相关的儿童的一些缺陷。


AI随后连续引用了三份研究结果来佐证自己的观点,首先是引用经合组织的建议,称应对贫困地区进行学龄前教育补贴,以改善这些地区儿童的未来表现。其次,AI还引用了60年代的一份研究称,学前教育能够对个人及社会未来长期发展带来帮助,远远超过为此需要付出的成本。最后,AI还引用了疾控中心的研究,称学前教育能够减少医疗成本、降低犯罪、对福利的依赖以及虐待儿童等。


因而AI的结论是,对学前教育进行补贴,能够让贫困家庭的儿童支付的起相关教育,让他们更好地为未来的教育做好准备。


Project Debater的整个陈述句式完整,逻辑清晰,尤其多次引用了过往的研究成果,包括经合组织的数据等,来佐证自己的观点。


随后人类辩手Natarajan做了针对性的开场陈述,不仅阐述了其在15分钟时间内所准备的内容,还对Project Debater的陈述,进行了有针对性的质疑。他指出,Project Debater的主要观点,基于一种“本能性”的结论,即我们如果认为学前教育总体上是好事,那么就理所应当对其进行补贴,但他认为,仅凭此就做出这样的结论还远远不够,这样的逻辑过于简单直接,他给出了例子进行反驳,例如如果一国增加对医疗的投入,也能够给整个社会带来福利,也能够对教育带来推动。


此外,他还指出,Project Debater忽略了在现实情境下,简单进行补贴并不一定能够达到预期的效果,尤其是针对学前教育的补贴,最终实际上是补贴在中产阶层身上,而这些阶层原先就有能力支付学前教育的费用,而补贴的钱由来自于所有人,因而对于贫困人群来说,反而带来了损害。Natarajan同时指出,如果目的是帮助贫困人群,那么在政府资金资源有限的情况下,应该考虑现实的限制,将资源最优化配置在能够达到这一目的的领域。


人类辩手的这一开场陈述,同样逻辑清晰,并且体现了人类在进行辩论过程中,能够根据对方的陈述,做出有针对性回应的特点,考虑到这位人类辩手是一位专业的辩论高手,因而在他的陈述中,也体现了许多专业性的辩论技巧,例如将辩题进一步细化,并引向对手方在陈述中暴露出的逻辑上的薄弱环节,比如Natarajan就针对了Project Debater在陈述中所表现出的“因为学前教育好,所以就要进行补贴”这样的简单粗暴的逻辑。


在接下来的驳论环节,辩论双方需要对对方之前所做出的陈述,进行针对性的回应,以进一步巩固自身的观点。


就这一轮环节来说,对于人工智能Project Debater的挑战在于,需要首先理解人类辩手在陈述中所进行的阐述,同时在其中找出其论证的一些漏洞或逻辑不严密的地方并对这些薄弱环节进行针对性回击。


Project Debater的设计者之一、IBM研究员Noam Slonim表示,这一轮对于AI来说是“挑战最大”的部分,对于AI来说,首先需要获得人类辩手之前陈述的词语,然后将这些词语组织成“有意义”的句子,再从这些句子中摘取出人类辩手陈述的要点,再对这些要点进行回应。


但遗憾的是,这一轮Project Debater的表现并不够好,这一轮也是最能反映出人和人工智能之间的区别的环节。尽管Project Debater准确地抓取了人类辩手在开场陈述中所提到的对于贫困人群帮助的问题,并进行进一步阐述,但却错误地理解了人类辩手的意思,Project Debater称,对方辩友说学前教育是有害(harmful)的,但实际上是AI错误地理解了人类辩手的意思,人类辩手说,过早的学前教育,可能让儿童在心理上产生挫折感,这样反而是有害的,而AI并没有将这样的完整的上下文全部吸收并进行正确理解。


随后,Project Debater的大部分陈述依然围绕着其相对简单的逻辑进行,包括有数据和研究表明学前教育对于儿童接下来接受学校教育更有帮助,以及学前教育可以降低犯罪率,所以要对学前教育进行补贴。


人类辩手在接下来自己的反驳环节,继续紧抓AI逻辑相对简单以及对情境的阐述过于理想化这一点进行攻击,指出,AI所提出的政府资金能够满足各个方面只是理想的状况,现实情况下,在政府资源有限的情况下,直接将资金拨给学前教育,并不一定是最理想的选择。


在最后总结陈词环节,Project Debater依然给出了标准完整的陈述,人类辩手在进一步阐述自身观点的同时,继续指出Project Debater的观点在论证逻辑上的不足。



本场辩论赛最终的输赢是根据赛前赛后观众投票结果的变化来决定,在比赛进行之前,现场的观众对该辩题进行投票,结果为支持补贴学前教育的观众占79%,不支持补贴学前教育的观众占13%,在辩论结束后,支持补贴学前教育的观众比例变为62%,而不支持补贴学前教育的观众占30%,也就是说,17%的观众的观点因为受到辩论的影响,由支持变为反对,根据这样的结果,本场辩论赛以人类辩手获胜而告终。


与此同时进行的另一个投票结果则并不让人意外,69%的观众认为,Project Debater让他们增加了知识。


从整场辩论赛的进程来看,进行地十分顺利流畅,无论是AI还是人类辩手,都在各自环节的指定时间内,准时无误地完成了自身的陈述,Project Debater从始至终保持了冷静平缓的语调,语速也从头至尾保持一致,这也完全符合外界之前的预期。有些出人意料的地方在于,AI时不时还会冒出一两句幽默,比如“对方辩友或许从来没有和机器进行过辩论”,还有“或许我自己无法亲身经历贫困是什么样的,也不应对目前的生活水平有任何抱怨”,所有这些小花絮,都让AI听上去更像一个有着独立思考能力和情感的人类,辩论赛的主持人也在开始前说,Project Debater是有性别的,是一位女性,并在辩论赛结束后称,AI展现出了“魅力”(Charming)。


当然AI自身存在的不足,也在整个辩论赛过程中很明显地暴露出来,而这些“弱点”也正好被其训练有素的人类辩手所利用,例如AI的逻辑结论相对简单,总体而言,AI的逻辑是,过往的经验和研究数据表明,A能够导致B、A也能够导致C或者D,如果B、C、D都是好的,那么就应该支持A,基于这样简单的因果逻辑所得出的结论在遇到很多现实问题制约以及其他变量因素时,并不能够完全成立。


当然,由于AI背后的海量数据资源的优势,AI在辩论过程中能够随意引用相关研究成果来佐证自己的观点这一点,要绝对远胜过人类,在赛后,人类辩手在接受短暂访谈时也提到,在辩论赛中,发现AI所具备的这种“潜力”,让他十分惊叹,他认为,如果人类也能够具备这样的能力,那么将在分析问题得出结论过程中得到更多的助益。


Noam Slonim表示,Project Debater的数据库包含100亿的句子,而该系统的能力在于在短时间里,从这些数据中找出能够用于当前辩题的词语,组成合乎逻辑的句子,再组成完整的陈述。


从当场AI的表现来看,Project Debater至少已经完成了在短时间内(15分钟),从数据库中寻找到能够用于当前辩题的词语,组成相关的句子,并形成逻辑相对严谨的陈述,但同时,在理解人类对手的陈述,抓住对方陈述的要点,甚至逻辑的薄弱环节方面,还存在很明显的不足。


无论结果如何,这场辩论赛向世人展示了AI所具备的另一种能力,在我们亲眼看到AI能够在国际象棋、围棋、电脑游戏方面能够轻松战胜人类顶级选手以后,在对语义、逻辑要求更高的领域,已经取得了非常惊人的进展。


在辩论赛后,Slonim接受采访时表示,自己愿意给Project Debater的表现打9分,他对于系统的表现十分满意,同时也指出在驳论阶段系统存在的不足。


“我们的最终目标是,当结果并不是非黑即白时,建立一个能够帮助人们做出基于证据的决策的系统。”Slonim说。


正如IBM 研究院主管Dario Gil在辩论赛开场之前所说,比赛的意义并不在于谁输谁赢,而是通过这样的方式,展示人类能够将AI更好地运用到分析问题、解决问题以及做出决策等方面的另一种可能性。


AI
推荐阅读

史海拾趣

General Transistor Corp公司的发展小趣事

随着技术的不断进步,GTC意识到仅仅作为分销商已无法满足市场需求。于是,公司开始逐步涉足电子元器件的生产领域,专注于研发和生产具有自主知识产权的产品。通过持续的技术创新和研发投入,GTC成功推出了一系列高性能的晶体管、集成电路等新产品,进一步丰富了其产品线。这些产品不仅在国内市场受到好评,还逐渐走向国际市场。

Fujisoku Corporation公司的发展小趣事

在电子废弃物处理成为全球关注焦点的背景下,“未来电子”积极倡导绿色生产和循环经济理念。公司投入大量资源研发环保型电子产品,并建立了完善的电子废弃物回收处理体系。通过技术创新和科学管理,“未来电子”实现了生产过程中的节能减排和废弃物的有效回收利用,赢得了社会各界的广泛赞誉。这一举措不仅提升了公司的社会形象,还为公司的可持续发展奠定了坚实基础。

Alpha Semiconductor公司的发展小趣事

Alpha Semiconductor位于美国加州硅谷的研发与生产基地是公司发展的重要支撑。在这里,公司拥有一流的研发团队和先进的生产设备,能够为客户提供高质量的产品和服务。硅谷作为全球科技创新的中心之一,为Alpha Semiconductor提供了丰富的技术资源和人才支持,使得公司能够不断推陈出新,保持在半导体行业的领先地位。

通过以上五个故事,我们可以看到Alpha Semiconductor公司在电子行业中的发展历程。从初创时期的代工服务起步,到后来的OEM定制产品、自主研发电源管理产品,再到高性能标准模拟和混合信号IC的制造实力,以及在美国硅谷的研发与生产基地的建立,每一个阶段都见证了公司的成长和进步。Alpha Semiconductor凭借着不断的技术创新和市场拓展,已经成为了半导体行业中的佼佼者。

芯茂微电子公司的发展小趣事

随着市场竞争的日益激烈和技术创新的加速推进,芯茂微电子也面临着越来越多的挑战和机遇。面对这些挑战,公司始终坚持不懈地推进技术创新和产品研发,不断提升自身的核心竞争力和市场地位。同时,公司也积极寻求新的市场机遇和合作伙伴,不断拓展业务领域和市场空间。正是这种对挑战和机遇的积极应对和坚持不懈的努力,让芯茂微电子在电子行业中不断发展壮大。

DENWIRE公司的发展小趣事

近年来,随着国家对集成电路产业的重视和支持力度的不断加大,芯茂微电子也积极响应国家号召,致力于推动国产集成电路产业的发展和自主创新。公司加强了对核心技术的研究和投入,积极引进和培养高端人才,加强与国内外知名企业和研究机构的合作与交流。同时,公司也积极参与国家重大科研项目和产业化项目,为推动我国集成电路产业的发展和自主创新做出了积极贡献。这些努力不仅提升了芯茂微电子的技术实力和市场竞争力,也为我国集成电路产业的发展注入了新的活力和动力。

以上五个故事仅代表芯茂微电子在电子行业发展过程中的一部分经历和成就。随着公司的不断发展和壮大,相信未来还会有更多精彩的故事等待我们去发现和书写。

德力康(DLK)公司的发展小趣事

随着电子行业的不断发展和变革,DLK公司也面临着转型升级的压力。为了适应市场需求的变化,DLK公司开始加快转型升级的步伐。一方面,公司加强了对新能源汽车、物联网等新兴领域的研究和开发;另一方面,公司积极探索智能制造、工业互联网等新技术在连接器生产中的应用。通过转型升级,DLK公司不仅提高了生产效率和产品质量,而且增强了企业的竞争力和可持续发展能力。

问答坊 | AI 解惑

STM32入门工具篇

介绍一下STM32开发都有什么工具,资料需要到什么地方下载。 一、STM32资料     ST对于其新的32bit MCU平台的重视程度可从其提供的应用笔记的数量和相应的参考代码上可见一斑。     STM32的全部英文官方版本下载地址: ...…

查看全部问答>

程序员面试宝典

内容我不多说了,对面试多多少少都会有帮助!写得不错,极力推荐!…

查看全部问答>

时序仿真过了,为什么实际的电路就是出现了一些错误

用CPLD实现一个辨向、4细分、计数的电路。 用时序仿真的时候,仿真的结果都是非常正确的。 在实际电路的时候发现出现5%的计数误差。 老师说在触发脉冲上升沿的时候,有可能计数脉冲跑掉了几个。 计数脉冲最大100KHZ,触发时钟脉冲达到50MHZ。 ...…

查看全部问答>

MmMapIoSpace的问题!!

我在程序中使用MmMapIoSpace操纵GPIO, 可是貌似没有效果,请各位老大帮忙看看!谢拉。          volatile static  S5PC100_GPIO_REG * pGPIOReg = NULL;           &nbs ...…

查看全部问答>

请问怎么样把UCGUI加载到编译器中呢?请高手指点一下。

我看了一篇《ucos II+ucGUI+s3c2410+LCD+触摸屏整合》后知道移植UCGUI需要修改的地方,但我不知道怎么样把UCGUI加载到编译器中呢?请高手指点一下。 …

查看全部问答>

[求助]return用法问题

void HookISR() using 1   //using 1 的意思是用寄存器1吗? { if (_bHook) return;    //这句是不是说如果_bHook的值为真的话,那么就退出这个函数呢,不再执行下面的语句?如果如果_bHook的值为假的话,就顺序执行下面的语 ...…

查看全部问答>

基于2440的wince 4.2的系统--为什么在增加串口驱动后,无法sleep!?

辛苦了2天,终于把调试口uart1修改为了com3,解决了搞波特率丢数据的问题.. 本以为可以好好休息了... 结果没有想到,在串口一切正常的时候,系统无法sleep了.. 按键待机之后,屏幕依然亮着,触摸无响应 由于调试口uart1修改为了com3,无法在调 ...…

查看全部问答>

lm3sapp_sysctl_sleepdsleep_note

lm3sapp_sysctl_sleepdsleep_note 应该是系统休眠,我不去看了,下了自己看…

查看全部问答>

在Q II环境下出现了如下警告,请教解决办法

在Q II环境下出现了如下警告,请教高人给予指点解决办法: ----------------------------------------------------------------------  1. Warning:  Found 6 output pins without output pin load capacitance assignment  &nbs ...…

查看全部问答>

MSP430G2553 DA问题

怎么用MSP430G2553  做DA转换器 输出电压  求帮助  本人新手 不懂  谢谢!…

查看全部问答>