历史上的今天
返回首页

历史上的今天

今天是:2024年09月23日(星期一)

正在发生

2019年09月23日 | 人工智能时代兴起,NLP何时能进入成熟期?

2019-09-23 来源:eefocus

NLP是计算机科学,人工智能和语言学的交叉领域。目标是让计算机处理或“理解”自然语言,以执行语言翻译和问题回答等任务。

 

随着语音接口和聊天机器人的兴起,NLP正在成为信息时代最重要的技术之一,同时它也是人工智能的关键部分。充分理解和表达语言的含义是一个非常困难的目标。

 

大部分NLP技术都是由深度学习提供技术支持。在深度学习中,表示学习试图自动学习来自原始输入的良好特征或表示。而在机器学习中手动设计的特征通常过多且不完整,需要花费很长时间进行设计和验证。而且深度学习提供了一个非常灵活、通用且可学习的框架,用于呈现视觉和语言信息的世界。最初,它在语音识别和计算机视觉等领域取得突破。最近,深度学习方法在许多不同的NLP任务中表现出了非常高的性能。这些模型通常可以通过单一的端到端模型进行训练,并且不需要传统的,特定于任务的特征工程。

 

虽然 NLP 研究领域已经在深度学习的帮助下取得了长足的发展,许多技术也已经商业化落地,但我们也需要知道,这个领域还有几个开放性问题等待解决 —— 如果它们也能比较好地解决,也许我们能迎来 NLP 科研成果与商业落地的一个新的高潮。


下面列举的 5 个开放性问题来自自学 NLP 的机电一体化本科生 Deepak Garasangi 在 Reddit 上的发帖讨论内容总结,并且参考了 Sebastian Ruder 曾经总结的 4 个开放性问题。按重要性从轻到重排序:

 

5. 评价指标

这个问题在领域内不算很大的瓶颈,但是经常有研究人员觉得有必要重新讨论这个问题,因为现行惯例里往往不问原因就沿用某些固定的架构、数据集和评价指标。有人这样总结:「随着我们探索越来越高级的认知任务,弄明白为什么某些方法、某些架构在某些时候能起到好的效果,这对我们非常有帮助。」

 

另外一种担忧是对于评价指标自身的,这些评价技巧、这些生成的数字到底能在多大程度上对应人类语言的多样性和表达能力?对这个问题的回答也可以帮助我们构建出更有趣的自然语言推理数据集。


拓展阅读:EMNLP 2017 论文《Why We Need New Evaluation Metrics for NLG》(https://www.aclweb.org/anthology/D17-1238)


4. 终生学习(Life long learning)

NLP 领域遇到的另一个棘手问题是为这几个问题设计解决方案:


低阶模型用于下游任务时的终生适配

迁移学习的应用

视觉、文本、音频等等语言相关模态的无缝整合

低资源情境中高效的跨任务迁移

拓展阅读:Sebastian Ruder 近期写了一篇文章,总结了 NLP 领域迁移学习的现状,AI 科技评论也做了编辑,可以点击阅读


3. 面向目标的对话系统

面向目标的对话系统(Goal oriented dialogue systems)


从 ACL 学会出版的论文集来看,近一两年的 ACL 会议、EMNLP 会议中研究面向目标的对话系统的论文都有大幅增加。这就是又一个开放性问题:如何设计具备常识、能在真实世界语境中与人类进行较长的、面向目标的交谈的机器对话系统。目前的研究思路包括:带有状态追踪的任务驱动的对话系统,使用强化学习的对话系统,以及很多别的新点子。


拓展阅读:在 NLP 中应用强化学习
https://www.csie.ntu.edu.tw/~yvchen/doc/KAIST19_Tutorial.pdf


2. 低资源语言

这可以算是最紧迫的问题。目前全世界大约有 7000 种语言,但这些语言中只有很小的一部分,大概 20 种左右,可以算是资源丰富的语言。这个问题除了很实际之外,在其中找到灵感、取得进展也相对比较容易。专家们认为可行的方向包括:


为低资源语言设计收集数据、用较小数据训练语言模型的方法

可以有效用于低资源语言的跨任务迁移方法

拓展阅读:详细的说明文章参见 http://www.cs.cmu.edu/~ytsvetko/jsalt-part1.pdf


1. 自然语言理解

没错,这就是那个最开放的问题,它和 NLP 领域中的许多具体问题也都息息相关。想要解决这个高阶的认知问题,可能需要我们从强化学习、领域适应、小样本/零样本学习等等领域中借鉴很多思想和方法,也还需要 NLP 研究人员们做出更多创新。


现阶段的研究落脚点包括:
共指消歧(Coreference resolution)、多义词解析(Polysemy)、文本/文档总结(Text/Document Summarization)

论证与推理,讽刺与幽默

高效地表征大文本

环境中的语言学习(Grounded language learning),比如联合学习一个世界模型和语言模型,并且学习如何在语言模型中使用世界模型。

 

Yoshua Bengio 曾说:「要有野心。不要(因为做 NLP 就)仅仅读 NLP 论文。要读很多机器学习、深度学习、强化学习的论文。」我们也希望各位研究者们可以打开眼界,多多参考以前和现在的包括别的领域的有用经验,才能解决更难的问题、做出更大的成果。


推荐阅读

史海拾趣

Electrolube公司的发展小趣事

在电子行业中,电池管理系统(BMS)的可靠性和耐用性一直是制造商关注的焦点。Electrolube公司凭借其在材料科学领域的深厚积累,成功推出了一款名为UVCL的新型UV固化涂层。这款涂层以其独特的特性迅速在市场中脱颖而出。

UVCL涂层采用先进的UV固化技术,能够在几秒钟内完成固化过程,大大提高了生产效率。同时,它还具有高效的湿气引发的二次固化机制,确保即使在阴影区域也能实现完全固化。这一特性对于BMS等复杂电子电路的保护至关重要。

为了将UVCL涂层推向市场,Electrolube公司的研发团队与客户紧密合作,克服了客户内部没有UV固化设施的难题。他们与信誉良好的供应商合作,提供了完整的解决方案,并成功为客户提供了原型样品单元进行现场测试。测试结果显示,UVCL涂层能够为电子电路提供最高水平的保护,且操作过程简单、应用速度快。

UVCL涂层的成功推出不仅提升了Electrolube公司在电子材料领域的地位,也为公司赢得了众多客户的信赖和好评。

Caddock公司的发展小趣事

为了进一步提升市场竞争力,Caddock公司积极寻求国际合作。通过与全球知名电子企业的合作,公司成功将产品打入国际市场,实现了品牌影响力的扩大和市场份额的提升。同时,公司还积极参加国际电子展会和技术交流活动,不断吸收行业前沿技术,推动自身技术创新和产业升级。

Aptos Technology公司的发展小趣事

随着全球电子科技行业的快速发展,Aptos也开始积极布局全球市场。公司在多个国家和地区设立了分支机构或研发中心,以更好地服务全球客户。同时,Aptos还加大了对新兴技术的研发投入,积极探索未来可能的发展机遇。展望未来,Aptos将继续致力于技术创新和市场拓展,努力成为全球电子科技行业的领军企业。

请注意,这些故事是基于一般性的行业趋势和公司可能的发展路径构建的,并非Aptos Technology公司的实际发展历程。如需了解该公司更具体的发展故事,建议查阅相关新闻报道或公司官方资料。

Corstat Containers公司的发展小趣事

在环保意识日益增强的背景下,Corstat Containers公司积极响应,推出了可回收、可降解的环保电子元件包装盒。这一产品不仅满足了市场对环保产品的需求,还为公司赢得了良好的社会声誉。同时,公司还加大了对环保技术的研发投入,不断推出更加环保、高效的电子产品包装解决方案,进一步巩固了其在电子行业的领先地位。

CBM_America_Corporation公司的发展小趣事

随着科技的快速发展,CBM_America_Corporation意识到传统电子产品市场的饱和趋势。为了保持竞争力,公司决定进行创新转型,将业务重心转向智能家居和物联网领域。通过研发智能家居设备和物联网解决方案,CBM成功打开了新的市场空间。同时,公司还积极拓展多元化业务,涉及到了电子支付、数据安全等领域,进一步提升了公司的综合实力。

BCD Semi(Diodes)公司的发展小趣事

作为一家高科技企业,BCD Semi(Diodes)公司深知创新是发展的核心动力。因此,公司始终将研发投入作为重中之重,不断加大对新技术、新产品的研发力度。通过持续的创新驱动,公司成功推出了一系列具有自主知识产权的高性能模拟半导体产品,为公司的长远发展奠定了坚实基础。

问答坊 | AI 解惑

打算出手买车了,不知道怎么选择

我想买车,听了朋友的话,我对奇瑞寒了心,朋友买了一辆奇瑞没开多久就坏了。。。在漫长的等待和多次沟通无效的情况下,只能无奈的将他的A520从4S提了回来。当时他曾经力排众意,在众多亲朋好友的反对声中,坚定的购买了奇瑞A520作为他有生以来的第 ...…

查看全部问答>

最全面专业的电容器剖析文章【转】

你知道显卡为什么会花屏吗? 没错,你肯定听说过\"主板爆浆\",或者你还在对商家唾沫横飞的\"专业分析\"深信不疑?但您知道\"爆浆\"为什么会发生,而爆浆产生的环境、条件、原理又是如何? 你可能也被主板或显卡花屏所困惑,你知道罪魁祸首很可能 ...…

查看全部问答>

求16*32的点阵论文

用的芯片是74HC04,74HC154,74HC595,AT89S52,只是单纯的文字显示,功能不一样的也行,我只是用来参考一下,硬件已有,只要论文,是完整的那种论文,不知哪位大哥有,可以发给我吗?hong85726@163.com 谢谢了...…

查看全部问答>

求助啊~~请问收发器MT8880怎么和电话线连起来啊?

请问哪位好心人能告诉我MT8880怎么和电话线连起来啊。。我想做一个控制器来解码DTMF信号。。。…

查看全部问答>

在WinCE下隐藏鼠标光标的问题

我的WinCE程序是带触摸屏的,想在WinCE下隐藏鼠标光标,该怎么做,请高手帮帮忙,谢谢!!(我刚做软件,还不是很会)…

查看全部问答>

How to calculate real RMS of voltage ?

How to calculate real RMS of voltage ?…

查看全部问答>

cpld中两个不同的信号能锁定到同一个管脚上吗?

在设计中,一个IN信号和一个out信号能锁定到同一个端口上吗?动态控制IN,OUT的变换。换句话说,我的管脚时而输入,时而输出。CPLD能实现同一个管脚两种不同的功能吗?…

查看全部问答>

为什么都是C?

为什么现在都在用C写? 我是个学生,上手直接学的STM8,而且是用的汇编,现在感觉很排斥C,这样下去是不是会有很多的障碍?是不是用C的效果更好?我知道汇编和C都会用就更好了,但现在就是越来越排斥C了、、、…

查看全部问答>

M-bus

我急需有关M-bus的资料,请朋友们帮我介绍一些?…

查看全部问答>

5V 300mA电池充电电路学习

    第一张图是全图,第二张图是左边部分的图,第三张图是右边部分的图 请问: 1.A点B点的电压各位多少? 2.紫色方框内的三极管,二极管,电容,电阻各起什么作用?实现的什么功能?即紫色方框内的整个工作原理是怎样的? 3.变压 ...…

查看全部问答>