历史上的今天
返回首页

历史上的今天

今天是:2025年03月12日(星期三)

正在发生

2019年03月12日 | 机器阅读理解首次超越人类!云从科技创自然语言处理新纪录

2019-03-12 来源:亿欧网

继国际象棋、围棋、游戏等领域之后,人工智能首次在深度阅读理解超越人类。

2019年3月8日,中国人工智能“国家队”云从科技和上海交通大学联合宣布,在自然语言处理(NLP Neuro-Linguistic Programming)上取得重大突破,在大型深层阅读理解任务数据集RACE数据集(ReAding Comprehension dataset collected from English Examinations)登顶第一,并成为世界首个超过人类排名的模型。

有评论认为,这会是机器深层理解人类语言的开端。

论文中,云从科技与上海交通大学基于原创DCMN算法,提出了一种全新的模型,使机器阅读理解正确率提高了4.2个百分点,并在高中测试题部分首次超越人类(机器正确率69.8%、普通人类69.4%)。

这一研究成果,在应用领域搭配文字识别OCR/语音识别技术后,NLP将会帮助机器更好地理解人类文字/语言,并广泛应用于服务领域:帮助企业判断客户风险、审计内部文档合规、从语义层面查找相关信息;在社交软件、推荐引擎软件内辅助文字审阅工作,从枯燥的人工文字工作中解放人类。

突破语义理解瓶颈

此次云从科技和上海交通大学在自然语言处理(NLP)领域的深度阅读理解上登顶RACE排行榜第一名。RACE是一个来源于中学考试题目的大规模阅读理解数据集,包含了大约28000个文章以及近100000个问题。它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章(Passage),针对提出的问题(Question)从四个选项中选择正确的答案(Answers)。该题型的正确答案并不一定直接体现在文章中,只能从语义层面深入理解文章,通过分析文章中线索并基于上下文推理,选出正确答案。相对以往的抽取类阅读理解,算法要求更高,被认为是“深度阅读理解”。

RACE数据集的难点在于:由于正确答案并没有直接使用文章中的话术来回答,不能直接从文中检索得到答案。必须从语义层面深入理解文章,才能准确回答问题。

解决方案

怎么让机器在庞大的题库文章中(28000个)找到正确的答案?

云从科技与上海交通大学首创了一种P、Q、与A之间的匹配机制,称为Dual Co-Matching Network(简称DCMN),并基于这种机制探索性的研究了P、Q、与A的各种组合下的匹配策略。

结果显示,采用PQ_A的匹配策略,即先将P与Q连接,然后与A匹配,策略都得到了更优的结果。

再将模型(基于PQ_A策略)与其他已知的模型、以及纯粹基于BERT自身的模型进行了比较,得到如下的结果:

从RACE leaderboard上结果比较可以得到以下结论:

·云从科技与上海交大的单体模型就已经超越榜单上所有的单体或Ensemble模型;

·云从科技与上海交大的Ensemble模型在高中题目(RACE-H)部分优于人类结果(Turkers)。

论文缘起

这篇论文的作者,来自中国人工智能“国家队”云从科技与上海交通大学。

云从科技孵化于中国科学院,2017年3月,承担国家“人工智能”基础项目——“人工智能基础资源公共服务平台”建设任务。

2018年10月的国家“人工智能基础资源与公共服务平台”发布会上,云从科技创始人周曦提出了人工智能发展五个阶段,核心技术闭环是五个阶段的重要基础。

从感知到认知决策的一系列技术组成了核心技术闭环:

1-感知技术:人脸识别、语音识别、文字识别OCR、体态识别、跨镜追踪(ReID)、车辆识别等

2-认知决策:自然语言处理(NLP)、脑科学、大数据分析(风控、精准营销)等

目前,云从科技承担了国家发改委与工信部的人工智能基础平台、人工智能应用平台和人工智能的核心芯片平台项目,包含智能感知技术和认知决策技术为核心的技术闭环,并刷新多项世界纪录,保持自主核心技术国际领先。

在这个基础上,云从科技正在致力整合算力、智力、数据等资源及其成果,打造人工智能开放平台与生态,进一步促进人工智能在金融、安防、交通、零售、商业等重要行业的落地与深度融合。

附:论文解读

1.DCMN匹配机制

以P与Q之间的匹配为例,说明DCMN的匹配机制。下图为P与Q之间的DCMN匹配框架。

云从科技和上海交大使用目前NLP最新的研究成果BERT分别为P和Q中的每一个Token进行编码。基于BERT的编码,可以得到的编码是一个包含了P和Q中各自上下文信息的编码,而不是一个固定的静态编码,如上图中Hp与Hq;

其次,通过Attention的方式,实现P和Q的匹配。具体来讲,是构建P中的每一个Token在Q中的Attendances,即Question-Aware的Passage,如上图中Mp。这样得到的每一个P的Token编码,包含了与Question的匹配信息;

为了充分利用BERT带来的上下文信息,以及P与Q匹配后的信息,将P中每个Token的BERT编码Hp,与P中每个Token与Q匹配后的编码Mp进行融合, 对Hp和Mp进行了元素减法及乘法操作,通过一个激活函数,得到了P与Q的最终融合表示,图中表示为Spq;

最后通过maxpooling操作得到Cpq,l维向量,用于最后的loss计算。

2.各种匹配策略研究

除了P与A之间的匹配之外,还可以有Q与A、P与Q之间的匹配,以及不同匹配得到的匹配向量间的组合,这些不同的匹配与组合构成了不同的匹配策略。对七种不同的匹配策略分别进行了试验,以找到更加合适的匹配策略,分别是:

[P_Q; P_A; Q_A], [P_Q; P_A], [P_Q; Q_A], [P_A; Q_A], [PQ_A], [P_QA], [PA_Q]

“PA”表示先将P和A连接为一个序列,再参与匹配,“PQ”与“QA”同理。符号“[ ; ]”表示将多种匹配的结果组合在一起。[P_Q; P_A; Q_A]模式下的模型架构如下图:

7种不同策略通过试验,采用PQ_A的匹配策略,即先将P与Q连接,然后与A匹配,无论是在初中题目(RACE-M)、高中题目(RACE-H)还是整体(RACE),该策略都得到了更优的结果。

推荐阅读

史海拾趣

Electro Adapter Inc公司的发展小趣事

作为一家以技术为核心的企业,EA公司始终将技术创新作为公司发展的重中之重。公司不断引进新技术、新工艺,加强与高校、科研机构的合作,共同研发具有自主知识产权的新产品。在智能电源适配器领域,EA公司率先推出了一系列具有智能化、网络化功能的产品,引领了行业潮流。这些产品的推出不仅提高了公司的市场竞争力,也为客户提供了更加便捷、高效的使用体验。

Digital Core Design公司的发展小趣事

随着《古墓丽影》系列游戏的成功,Core Design的团队迅速扩张。当PS2主机即将推出时,索尼和Core Design都对这款新主机充满期待。为了抓住这一机遇,Core Design将“古墓丽影”的制作团队从最初的12人增加到60人,随后又增加到了100人。这一举措展示了Core Design对市场和技术的敏锐洞察力和决心。

CITIZEN公司的发展小趣事

进入21世纪,西铁城公司在技术创新方面继续取得显著进展。其中,光动能技术的开发是公司历史上的一大里程碑。1995年,西铁城推出了第一只光动能手表,这一技术能够吸收任何可见光源并转化为动能,为腕表提供持续的动力。随后,公司不断对光动能技术进行改进和优化,使其更加精确、高效。这一技术的成功应用,不仅提升了西铁城产品的竞争力,也为整个电子行业带来了新的发展方向。

ACP Optoelectronic Technology Co Ltd公司的发展小趣事

ACP Optoelectronic Technology Co Ltd,在创立初期便专注于光电技术的研发。某年,公司研发团队成功开发出一种新型光电传感器,其性能远超当时市场上的同类产品。这一技术突破迅速吸引了行业内的关注,公司因此获得了大量订单,业绩迅速攀升。随着技术的不断完善和市场的不断拓展,ACP Optoelectronic Technology Co Ltd逐渐在光电领域崭露头角。

Flexxon Pte Ltd公司的发展小趣事

2020年新冠疫情的爆发对全球供应链造成了巨大冲击。然而,Flextronics(Flexxon Pte Ltd)凭借其强大的供应链管理和风险管理能力,迅速调整生产计划、优化资源配置、加强员工健康防护,确保了生产线的稳定运行和订单的及时交付。在疫情期间,Flextronics还积极为客户提供远程技术支持和解决方案,助力客户应对市场挑战。这一系列举措不仅展现了公司的韧性和实力,也进一步巩固了其在电子制造服务领域的领先地位。

ALLEN BRADLEY公司的发展小趣事

Flextronics(虚构为Flexxon Pte Ltd)自上世纪90年代末成立以来,便致力于成为全球供应链整合的领军者。公司最初从新加坡起步,迅速在全球范围内建立了多个生产基地和研发中心,以满足客户对电子产品快速响应和高质量生产的需求。通过高效的供应链管理,Flextronics不仅缩短了产品上市时间,还大幅降低了生产成本,赢得了包括惠普、戴尔、诺基亚等国际巨头的信任与合作。

问答坊 | AI 解惑

帮我看看12864的读数据操作写得对不对

void LcdWriteData(unsigned char data) { CheckBusy();           //忙检查 DDRB=0xff;             //数据端口设置为输出 SET_RD;     ...…

查看全部问答>

基于LPC和GPS的汽车防盗系统

想用NXP LPC1000来设计一个基于LPC1114和GPS的汽车防盗系统。…

查看全部问答>

求教debug 调试程序出现 has exited with code 0 (0x0).

第一次在开发板上测试就遇到这种奇怪问题... build 已经成功,在PPC2003模拟器上也运行正常,但是接到开发板上就出现问题,程序无法打开。 用网线联调 发现output 内容如下: Load module: /FlashDrv/My_PJtest/My_PJtest-armv4i-IngenicMedia (M ...…

查看全部问答>

1602a与计算器

怎样将万年历与计算器和为一体用液晶1602a单独的程序已编制好。…

查看全部问答>

关于KEIL的错误提示

我编译完程序后点击错误提示,正常情况下光标会跳到错误行哈,可我点击错误提示后跳出对话框说路径未找到,例如:“F:\\开发\\主程序\\D未能找到”。请教高手这个错误是怎么发生的啊?该如何改正啊?…

查看全部问答>

ST将在9月份在全国10个城市举办STM32的技术研讨会!最新消息

ST将在9月份在全国10个城市举办STM32的技术研讨会,这次研讨会的一个主要目的是对大家在使用STM32过程中的一些疑问进行解答和澄清。目前我们正在准备一些技术方面的文档,为了更广泛的满足大家的要求,在这里我请大家提出一些建议,包括:-你 ...…

查看全部问答>

请教音频输出用普通模拟电缆最远能传多远?

请教大家个问题,音频输出用普通模拟电缆最远能传多远?谢谢!…

查看全部问答>

msp430+拓普微液晶屏问题。

430能直接驱动拓普微LM320240型号的液晶屏吗?能的话怎么驱动呀,望能解答。。。谢谢!…

查看全部问答>

LPC1700 RTC应用

LPC1700 自带RTC,可以产生两种中断,一种是年、月、日、时、分、秒、周、一年中的第几天等的增值中断;另外一种是当前时间与报警时间相同时报警。   RTC的寄存器不多,定义如下:   // 中断位置寄存器(ILR-0x4002 4000)#define ...…

查看全部问答>

adC12 F149 多通道 采样的时候出现问题 求大神解决 坐等答案

//****************************************************************************** // AD12  多路 初始化。。 //****************************************************************************** //AD12    初始化 vo ...…

查看全部问答>