历史上的今天
返回首页

历史上的今天

今天是:2024年12月31日(星期二)

正在发生

2019年12月31日 | 机器人聊天是个技术活 需要对语言和语境进行深度理解

2019-12-31 来源:科技日报

人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。

“我想买手机有什么推荐吗?”“的不错,我之前一直用三星的。”“魅族是国产手机十大品牌之一,好不好,用了才知道哦。”“小米也不错。”“小米比大米有营养。”这些看似时而认真,时而无厘头的对话和我们日常微信群聊看似并无二致,但其实在这个群里聊天的都是机器人。

能让机器人们聚在一起好好聊个天可是个技术活,不仅要把多智能体强化学习的方法应用在自然对话场景中,还需要优化社交机器人在不同上下文语境下的谈话策略。在日前天津高新区举行的第三届社交机器人暨首届机器人群聊比赛研讨会上,多个社交机器人在同步对话的比赛现场一较高下。

 

这群机器人聊天有点“尬”

据了解,本次比赛尝试将多智能体人机对话的技术应用在自然对话场景中。比赛选取特定主题的启动句,打乱启动顺序,经过单轮或者多轮,生成符合主题且流畅的对话,最终采用自动评价和人工评价相结合的方式,根据主题相关性、语言流畅性和语境相关性进行打分。

“刚刚还是一群在认真聊天的机器人,却可能因某一个机器人的话锋一转,整个话题就被带入尬聊场景。就像那个推荐手机的话题,明明是在聊手机,就因为一个机器人说了小米,整个话题就变成了美食和养生。”大赛组委会委员、哈尔滨工业大学副教授张伟男介绍说,通过这次比赛,我们看到机器人们的聊天能力有所增强,但是与真人聊天相比还存在几个问题:多样性程度比较低,语言比较贫乏,回复重复率高;一致性能力弱,同一个群聊下,机器人经常前后回复出现矛盾;主题漂移,就是我们常说的跑题,几乎每个群聊到最后都跑题;质量不稳定,回复质量差的机器人严重影响群聊质量,机器人不能很好地筛选对话进行回复决策。

三种主流技术各有优缺点

让机器人群聊看似简单,却都需要人工智能的交互式实现技术——人机对话技术的发展作为支撑。获得首届机器人群聊大赛第一名的队伍FunNLP的指导老师,天津大学副教授张鹏介绍说,在研究上,和共同推动了自然语言理解技术的发展。目前实现人机对话有三种主流技术,各有优缺点。

基于规则的人机对话系统,机器人需根据系统中预先定义的一些规则来进行回复,例如关键词、-else条件等。这种技术最大的缺点是需要人工撰写规则,要定义的规则太多,需要付出极大的努力来做规则设计。

基于检索的人机对话系统,直接从预先定义的候选池中选择最佳的答案,但缺点是无法应对自然语言的多变性、多义性、语境结构、连贯性等,且当输入消息的语义差别很小时,机器人便无法精确识别,以至于无法生成新的回复。

“目前基于生成模型的人机对话系统是研究的热点。”张鹏表示,与检索型对话机器人不同的是,它可以生成一种全新的回复,因此相对更为灵活。但是这种系统有时候会出现语法错误,或者生成一些没有意义的回复。

目前还难达人类对话水平

在我们日常生活中,不同类型的人机对话可谓是随处可见:闲聊式对话,如微软小冰;任务驱动的多轮对话,如订餐对话系统等;问答式的对话,如汽车语音系统;推荐式对话,如一些客服机器人。其中闲聊、问答和任务型对话是用户输入内容后系统才会给出相应的回复,而推荐式系统主动向用户提供服务和信息。但由于各项技术尚未成熟,因此对话机器人还达不到类人的对话水平,表现不够灵活,甚至会产生一些笑料。

对于本次比赛的机器人在群聊回复方面出现的一些问题,张鹏解释说,这主要是由三方面原因造成的。首先对话机器人在理解群聊对话记录,回复的情感一致性及与其他机器人的交互三个方面存在一定的问题。所以群聊过程中出现了机器人自顾自回复或者是矛盾性回复等现象。

其次,训练机器人聊天是需要大量数据的,但某些特定领域的对话数据相当有限,如本次比赛中的数码产品和美食主题。并且,这些领域的中文闲聊型对话数据的收集和对话系统的构建都是十分耗费人力的。

第三,目前基于的对话系统主要依赖于大量结构化的外部知识库信息和对话数据,系统通过训练来“模仿”和“学习”人类说话,这也导致了回复语句单一的问题。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。

像人一样聊天还需深入理解语境

“虽然深度学习技术被充分运用,技术水平有所提高,但是以目前的技术来说,要做到让机器人像人一样聊天还有一定的难度。”张鹏表示,人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上,朋友们在聊天时甚至能在对方说话之前就预料到下一句会说什么。

若想要达到相当于人类对话的水平,目前有几种方法可以探讨。其中一种是构造庞大且高度复杂的模型,如现在基于Transformer结构的Bert模型和GPT模型,其参数量已达到数亿级。然而模型越大,从用户输入信息到对话系统反应之间的延时就越长,而且实质上,此类模型仍然需要依赖于大量的数据,这与人类的思考和学习方式不符。

第二种是Meta Learning技术,这种技术需要机器人具备学会学习的能力,能够基于过往的经验快速地学习。这类模型是模拟人的思考与学习方式,从本质上更接近人类间的相互对话。但问题是我们需要结合具体的任务,提出基于Meta Learning的解决方案,这无疑需要更加深入的研究。

第三种是强化学习技术,强化学习系统由智能体、状态、奖赏、动作和环境5部分组成。现在的研究工作主要是将强化学习应用于任务型对话系统的策略学习上,强化学习能解决基于规则策略存在的泛化能力差、人工成本高等问题,并且无需大量的训练语料,只需要一些目标,便能够提高任务型对话的质量,弥补了深度学习的一大缺点,当然强化学习也会带来很多挑战,比如智能体会给当前互动的环境带来一定的影响等,这些都是需要我们去不断探索和深入研究的。

推荐阅读

史海拾趣

Ametek公司的发展小趣事

Ametek公司成立于1930年,总部位于美国宾夕法尼亚州伯温。它是一家跨国公司,涉足电子仪器和电子设备的设计、制造和销售。以下是关于Ametek公司发展的五个相关故事:

  1. 初期成立与增长:Ametek最初成立为一个机械仪器制造商,专注于生产电动车和电动车零部件。随着时间的推移,公司逐渐扩展业务,开始涉足电子仪器和设备的制造,并迅速取得了成长。

  2. 收购与多元化发展:Ametek通过一系列收购和合并扩大了业务范围。这些收购使得公司能够进入新的市场领域,并获得新的技术和产品线。例如,1998年Ametek收购了Programmable Power,进入了电源和电源测试设备市场。这种多元化战略为公司带来了更广泛的客户群和收入来源。

  3. 技术创新和研发投入:Ametek不断投入研发,并推出了一系列技术创新产品。公司在测量、测试和分析技术方面取得了重大突破,为客户提供高质量的解决方案。Ametek的产品包括精密仪器、检测设备、传感器等,广泛应用于航空航天、能源、制造业等领域。

  4. 全球扩张与市场布局:Ametek通过建立全球销售网络和设施,实现了全球市场的扩张和布局。公司在北美、欧洲、亚洲等地设有多个生产基地和销售办事处,为客户提供及时的服务和支持。这种全球化战略使得Ametek能够更好地满足不同地区客户的需求,并加强了在全球市场的竞争力。

  5. 持续增长与业绩表现:Ametek持续实现了稳健的增长和良好的业绩表现。公司不断推出新产品、拓展市场,并通过提高生产效率和降低成本等措施提升盈利能力。Ametek的业绩稳步增长,为股东创造了可观的价值,并使得公司成为电子仪器和设备行业的领先企业之一。

这些故事展示了Ametek公司从成立初期到如今在收购与多元化发展、技术创新与研发投入、全球扩张与市场布局以及持续增长与业绩表现等方面取得的重要进展。

CANDD公司的发展小趣事

为了进一步提升品牌影响力和市场份额,CANDD公司开始实施国际化战略。公司首先在欧洲市场设立了分公司,并成功打开了欧洲市场的大门。随后,公司又进军亚洲市场,通过与当地企业的合作,逐渐在亚洲市场站稳了脚跟。随着国际化战略的深入实施,CANDD公司的品牌知名度和市场份额不断攀升。

FEIG ELECTRONIC公司的发展小趣事

Digi-Key作为全球知名的电子元器件分销商,与FEIG ELECTRONIC建立了长期稳定的合作关系。通过这一合作,Digi-Key为FEIG提供了全球范围内的分销服务,将FEIG的产品推向了更广阔的市场。同时,Digi-Key还为FEIG的产品提供了专业的技术支持和售后服务,进一步巩固了FEIG在RFID领域的领先地位。

Apx-Crystal公司的发展小趣事

Apx-Crystal公司起初是一家专注于研发新型晶体振荡器的小型科技公司。在创始人的领导下,团队通过不懈的努力,成功研发出了一款具有高稳定性和长寿命的晶体振荡器,这一技术突破在行业内引起了广泛关注。随着产品性能的不断提升和成本的有效控制,Apx-Crystal开始赢得越来越多客户的青睐,市场份额逐年攀升。公司逐渐扩大生产规模,并在多个国家和地区设立了销售和服务网络,实现了从初创企业到国际知名电子元件供应商的华丽转身。

ATM [Advanced Technical Materials]公司的发展小趣事

中国ATM的发展历程始于20世纪80年代中期。1987年,中国银行在珠海推出了中国大陆第一台ATM,标志着ATM在中国开始了发展。随后,经过数十年的快速发展,中国ATM市场经历了多个阶段,从初级阶段到专业化阶段,再到如今的快速发展阶段。中国ATM市场的繁荣,不仅反映了国内银行业电子化建设的成果,也体现了电子行业的快速发展和普及。

BETA Transformer Technology Corp公司的发展小趣事

BETA Transformer Technology Corp公司深知人才是企业发展的核心动力。因此,公司高度重视人才培养和团队建设。BETA公司建立了一套完善的人才培养机制,通过内部培训、外部学习等方式不断提升员工的技能水平和综合素质。同时,公司还注重团队建设和文化建设,营造了一个积极向上、团结协作的工作氛围。这些举措使得BETA公司的员工队伍更加稳定、高效,为公司的长期发展提供了有力保障。

以上五个故事分别从不同角度描述了BETA Transformer Technology Corp公司的发展历程和取得的成就。虽然这些故事是虚构的,但它们反映了电子行业中企业可能面临的挑战和机遇,以及应对这些挑战和机遇的策略和措施。希望这些故事能够满足您的需求。

问答坊 | AI 解惑

如何测试单片机系统的可靠性

读者希望了解用用什么方法来测试单片机系统的可靠性,邓宏杰指出:“当一个单片机系统设计完成,对于不同的单片机系统产品会有不同的测试项目和方法,但是有一些是必须测试的:     1.测试单片机软件功能的完善性。这是针对所有单片机 ...…

查看全部问答>

我最近想实现s3c2440的USB device,哪位高手有经验,帮帮忙!

我最近想实现s3c2440的USB device,不知道有没有高手实现过,给点帮助,谢谢了,不是在Linux下,不带操作系统的。…

查看全部问答>

DXP打印问题

DXP里要打表面层的图时图纸怎么集中啊?我打出来的老靠往上,怎么调整呢?谢谢大家的帮忙!…

查看全部问答>

如何高效运用嵌入式ARM程序开发?

在多媒体、通信等计算复杂度高的应用中,为了满足制造费用、功耗、性能以及实时性等诸多**条件的要求,嵌入式系统程序往往需要特殊设计。这使得设计师在设计面向特定应用的嵌入式软件时,需要有一套切实可行的编程准则。而在实际程序设计中,工程师 ...…

查看全部问答>

本版主最近请到一位高人,在ST10方面有很深造诣,在此帮助

请各路英雄留下你们的问题,高人会经常过来巡视并解答问题。特此公告,敬请互相转告。谢谢!…

查看全部问答>

DMA用于通信,如何判断前次操作完成

我想用DAM做USRAT1 发送,在发送下一个数据包之前,首先应该判断上一个数据包是否发送完毕。或者一个DMA通道分时复用IIC和USART通信,需要对上次的传输是否完成进行判断。使用了下面的判断语句:while (DMA_GetFlagStatus(DMA1_FLAG ...…

查看全部问答>

【求助】关于SD16在输入通道短路后采样数据不为零

SD16在F42X0出现,我在使用F4250的时候发现这样一个问题,就是用通道7测量失调 电压与将AD输入端口短路(我是在芯片引脚上短路的,应该不会引入其它的干扰信号)测得的电压不同. 我在用通道7测得各个PGA放大倍数的失调电压后,再切换到通道0,将通道0 ...…

查看全部问答>

新手学习vxworks需要怎么入门

我想学习vxworks,需要准备什么东西?用什么编程环境?…

查看全部问答>

AVR单片机工具软件集锦

AVR单片机工具软件集锦…

查看全部问答>

STM32录音问题

目前采用是是STM32F205主控芯片,需要增加语音录入功能,需要得到WAV格式语音数据。 准备采用ADC采样,得到的是原始的二进制数据。有两个问题不是特别清楚,想请问版上 各位达人: 1.是不是通过定时器控制AD采样的速度就可以控制音频信号质量?获 ...…

查看全部问答>