历史上的今天
返回首页

历史上的今天

今天是:2025年01月16日(星期四)

正在发生

2018年01月16日 | AI大航海时代,对话机器人如何引领交互方式变革

2018-01-16 来源:电子产品世界

自计算机出现以来,人机交互界面经历了命令行到图形化界面的更新迭代,而随着人工智能(AI)在生活中的逐渐普及和应用,例如苹果的Siri、亚马逊的Alex,甚至是京东的JIMI已经纷纷闯入我们的生活,我们现在正在经历从图形化界面向对话式界面的技术变革时刻,而这其中,对话机器人的发展将会是一个关键点。下面就随那我来体现小编一起来了解一下相关内容吧。

图形化界面VS对话式界面

比较一下图形化界面和对话式界面,主要有以下四点差异:

1)图形化界面是二维的,更加重视广度;对话式界面是一维的,更加注重深度,用户可以更专注于一件事情上。

2)图形化界面更加注重空间感,主次关系也要通过颜色和距离感来实现差异化,这是图形化界面设计时的一个原则;对话式界面更加强调的是时间感,例如刚刚讨论的话题,过一段时间讨论同样的话题就不太重要了。

3)图形化界面更加强调共性,就用户体验来看,在图形化界面,同一个系统中每个人看到的东西都差不太多;对话式界面则更强调个性,我们每个人的对话内容都是不一样的,对话机器人和我说的话应该和另外一个人说的话不一样,更加偏个性一些。

4)图形化界要求比较稳定,用户希望不要天天改版;对话式界面则是进化的,用户更希望说过的话不需要一遍一遍地再去重复。

由此可见,在更注重个性化和精准度的当下,对话式界面显然更符合用户需求。

对话机器人分类

对话机器人根据应用场景不同主要可以分为三类:个人信息助理、聊天机器人和客服导购机器人。

个人信息助理是用对话形态做人机交互比较好的应用场景,同时由于基本上都是由行业巨头在做的,例如苹果、谷歌、亚马逊等,因而发展速度较快,应用也比较多。爱因互动CTO洪强宁先生介绍称,其实,这一领域也确实应该由巨头来做,因为入口是个人信息助理最核心部分,要想将其做好,就要能够实现快速调动,而最好的入口资源大部分都是掌控在巨头手中的。同时,随着技术飞速发展,也有很多不同技术在个人信息助理中应用来提升其用户体验,预计一两年后,大家会比较习惯用个人信息助理,例如智能手机、智能手表及家里的智能音箱。

聊天机器人相对于另外两类对话机器人较为简单,这类机器人并不能完成具体某项任务,主要用作心理陪伴和娱乐。针对这类对话机器人,对话轮次是一个比较重要的技术指标,能够与用户进行自然对话轮次越多,时间越长,可以说机器人的能力就越好。目前来看,业内最好的聊天机器人能够与人类自然对话二十多轮,再往后聊,你就能够发现它跟不上人类的思维了。目前应用在聊天机器人上比较好的技术是Chitchat-Bot技术,为了提高其在聊天中的应对能力,还需要使用诸多增强技术,例如为聊天机器人注入背景信息、个人信息、知识库信息,并引入上下文等。

客服导购机器人是为了完成一件事情与机器人沟通,最后能够达到某种目的。在这种应用场景中,尤其是在做售前应用时,主要有三种主要的对话形态:人主导的形态,即人问一个问题,机器回答一个问题;机器人主导形态,即机器人问人问题,人来回答;交叉主导形态,即人问一个问题,机器人发现不知道该怎么答,会反问一句,人回答了机器人的问题之后,机器人再给出答案。大体上可以分成这三种形态,很多其他复杂的对话则是由这三种形态反复切换来实现。其中人主导的形态是最简单的形态,也是目前在商业应用中最为成熟的形态。

作为AI领域重要重要内容之一,对话机器人有怎样的技术要求?需要怎样的工程团队?初创企业又该怎样入局?近日,《电子产品世界》编辑在“AI时代的移动技术革新”大会上采访了爱因互动CTO洪强宁先生。

语音市场发展趋于成熟,创业公司更应关注语义

电子产品世界:在对话机器人领域,创业公司应该怎样选择切入点?

洪强宁:语音转文本和文本转语音,现在都有比较专业的公司在做,而且很多企业做得已经很好了,对于创业公司而言,我们觉得现在再去做语音就是技术的浪费了,而更应该将资源用到像语义这样发展还不是很完备的方向。

现在在做语义的大概有两种形态:一种形态是做基础语义服务的,并不在乎具体的应用场景,例如情感探测、实体抽取等;另外一种是做应用场景的,像我们是在考虑机器人在具体应用场景下该怎样去回答问题,和场景与行业联系的非常紧密。

在真实的应用场景中,需要用到语音合成的时候,我们会调用第三方的平台来生成文本,例如科大讯飞语音做得已经很好了,我们可以直接使用科大讯飞的技术完成前面语音合成部分,而从文本理解是什么含义的时候则是用到我们自己的技术,因为这项技术还没有一家公司声称做出了一个任何场景都可以使用的平台,针对售前对话机器人,我们的技术效果是更好的;同时,这也是我们的核心竞争力和技术壁垒,我们需要在这上面去深入研究。

机器人服务平台要先做专用领域

电子产品世界:如何理解现在的通用机器人服务平台和专用机器人服务平台?

洪强宁:工程团队的一个非常大的产出是在机器人服务平台上,但是创建对外开发的机器人服务平台目前从商业上看还不是一个好的时机,因为现在对话机器人仍然是和场景紧密结合的,现在还不太可能脱离场景去搭建一个通用的机器人服务平台。

实际上,前两年已有通用的机器人服务平台出现,但是效果都不是很好。因而我们更加倾向于做行业专用的平台,先使机器人服务平台在售前应用中用起来效果非常好,之后再在这个基础上做泛化,做到其他场景中去。

现在我们正在规划一个大的机器人服务平台,这个是一个工程化的事情,需要做云平台、PAAS架构,需要在服务功能飞速增长的时候有一个非常好的、稳定的服务,能够包括像大数据处理等。这个机器人服务平台是我们内部自己用的,是为了加快算法调优的速度,使算法工程师不再需要去关心一些工程上的技术细节,更专注到算法调优本身。

对话设计工程师将会成为新岗位

电子产品世界:AI创业公司更需要怎样的人才,对工程团队有怎样的要求?

洪强宁:对于AI创业公司来说,更需要的是项目落地人才,即能够把AI的技术应用到具体场景中的人才。如果是纯研究算法的人,对于高校或者是研究院会更小,而对于创业公司则会更关注落地的能力,我们追求的是效果,而不是炫酷的技术,有的时候会发现深度学习的效果还不如一些传统方法的时候,我们也会选择传统的方法。

同时,工程团队也需要懂AI算法。工程团队如果完全不懂算法的话是无法和算法工程师进行配合的,工程团队做的很大一部分是建立机器人服务平台,算法工程师是平台的用户,因而工程团队需要知道算法工程师需要的东西是什么,从而给他们提供好用的工具,也需要了解AI是怎么做的,至少需要知道数据是怎样组织的、训练是怎么一回事、模型是怎么加载的,在这些地方,哪些是性能的瓶颈,这都需要工程团队的工程师完全了解的。

电子产品世界:做对话机器人的公司相对于其他AI行业会有怎样的特别需要?

洪强宁:在对话机器人领域,产品经理有一个很重要的工作职责是做对话设计,这个也可能是未来可能产生的一个新岗位。现在对话机器人的技术还做不到完全像人一样沟通,这个岗位要考虑的是当机器和人对话的时候,如何设计机器人的语言,使整个对话变得更自然,这个技术在真实落地的应用中是一件很重要的事情。

AI人才紧缺现状与高薪资现状

电子产品世界:如何理解AI人才紧缺和高薪资这一现状?

洪强宁:掌握新技术的人就是整个社会的推动力,社会也一定对这种人才的需求是非常旺盛的。其实我们现在身处第四次工业革命的开始阶段,在变革的早期,这样的人才很少,掌握这类技能的人才被市场争抢在所难免。在任何技术早期,你掌握了这项技术,薪资都会相对较高,但是同时也会有这样一个趋势:AI技术越来越成为程序员一个基础技术。例如谷歌在面试程序员的时候,不论你面试的是哪个岗位,都会考察你的AI能力。

这就类似云计算的发展,云计算发展这么多年,现在工程师如果不懂云计算的基础知识就不是一个合格的程序员。未来,十年以后,如果不懂得AI的工程师就不是一个合格的程序员。随着掌握AI技术的人群越来越多,薪资水平也将会逐渐回到一个相对合理的状态。

AI创业公司与大公司竞争的优势

电子产品世界:与大公司相比,创业公司有哪些竞争优势?

洪强宁:相比巨头公司,创业公司动作更快,关注点更超前。创业公司更多专注于场景,而对于单个场景的投入,大公司往往是不足的,只有可能触及到平台利益时,大公司才会投入大量资源与创业公司竞争,而只要创业公司在这之前建立起很好的竞争壁垒,是不害怕这样的竞争。

AI行业其实一个很好的范例,AI行业需要的是数据的积累,而不论是大公司还是小公司都需要时间的积累收集数据和处理数据,例如收集数据、清洗数据、理解数据以及结合应用场景的过程,而这些都需要时间和经验的积累,并不是说大公司会比小公司拥有有更多的竞争优势。

对话机器人的准确率评判指标

电子产品世界:如何评判对话机器人的准确率,现在对话机器人准确率是多少?

洪强宁:对话机器人大概可以分为两类:闲聊机器人和任务导向机器人。对于闲聊机器人,对话轮次是一个评价指标,时间越长,机器人做的就越好;而对于任务导向机器人,主要有两个评价指标:任务完成率和拦截率。

对于任务导向机器人,我们是希望他可以帮我办事的,这个时候,对话轮次就不再是一个很好的指标,相对短的轮次反而会更好;针对此类机器人,单轮对话会有准确率的概念,具体指机器人对用户提问响应是否正确就是准确率,此时任务完成率会作为核心指标。

而有些准确率的数据是不可信的,例如机器人自己对自己作出决策和评价,即拦截率。这是指你说的话,机器人觉得可以回答的比率;而准确率是指我答了,而且还答对的比率。因而准确率是要比拦截率要低一些的。

现在的准确率还是要人来判断的,而为了降低工作量,机器人可以先做一个预判,然后人再做更正。针对对话机器人,具体准确率要分应用场景,越复杂、用户说的话越发散,准确率会越低,大体上应该会在70%—90%之间在波动。如果是单轮,主要还会取决于知识库的建立情况,一般在80%到90%之间波动。

对话机器人要达要到人的平均水平,至少还要十年

电子产品世界:当下很多智能产品并不够智能,对话机器人也还处在“低配智能”阶段,还要多久我们才能到达“高配智能”阶段?

洪强宁:现在对话机器人,甚至AI还处在早期大航海时代,大家都在尝试在各种应用场景下使用这个技术,根据反馈去优化和调整。我们会全力以赴地关注用户的反馈,快速更新技术,并不断完善我们的产品。

就智能的程度而言,现在确实是受限的,不光是对话机器人,整个AI行业都存在这个问题,不管是深度学习,还是传统机器学习方法,都面临着准确率不为100%的现状。通过学习大量的现有知识,然后生成一个模型,用这个模型去匹配现有的知识,预测之后的输入可以给出一个怎样的输出,这样的一个模型永远都会与真实模型有一定的误差。虽然可以用深度学习的方法不断增加学习信息,准确率会越来越高,但永远都无法达到100%。

我们并不能够期望对话机器人不出错,要期望的是对话机器人出的错要比人少。我觉得现在谈像人一样的对话机器人还尚早,至少还要两三年,对话机器人在某些特定场景能够达到人的平均水平;而要谈通用对话机器人能够达到人的平均水平,甚至在某些特定场景超越人类,至少还要十年之久。

以上是关于网络通信中-AI大航海时代,对话机器人如何引领交互方式变革的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

推荐阅读

史海拾趣

EXCELTA公司的发展小趣事

随着科技的不断进步和市场的不断变化,Excelta始终将技术创新作为公司发展的核心驱动力。公司投入大量资金和资源进行技术研发和产品创新,不断推出具有竞争力的新产品。其中,一款高性能的微型连接器产品凭借其出色的性能和稳定性在市场上取得了巨大成功。此外,Excelta还积极探索新的应用领域和市场机会,为公司的持续发展注入了新的活力。

安碁科技(AKER)公司的发展小趣事

随着市场需求的不断增长,安碁科技开始寻求扩大产能和全球化布局。1999年,公司正式量产电压控制振荡器(VCXO),并购置了更大的厂房以扩大产能。随后,安碁科技陆续在美国和中国大陆设立子公司和办事处,进一步拓展国际市场。这一系列的举措,不仅提高了公司的产能和效率,也使其能够更好地服务全球客户,实现业务的快速增长。

乾坤(Cyntec)公司的发展小趣事

乾坤(Cyntec)公司在电子行业初创时期面临着诸多挑战。由于市场上已经存在多家知名的电子产品制造商,作为一家新兴公司,乾坤必须要在激烈的市场竞争中找到自己的定位。公司创始人深知,只有通过技术创新和产品差异化,才能在市场中站稳脚跟。于是,他们投入大量资源进行研发,专注于开发高性能、高稳定性的电子元器件。经过一段时间的努力,乾坤成功推出了一系列具有自主知识产权的新型电子元器件,这些产品很快在市场上获得了良好的口碑,为公司的后续发展奠定了坚实的基础。

Electronicon Kondensatoren GmbH公司的发展小趣事

ELECTRONICON Kondensatoren GmbH,其前身为RFT Kondensatorenwerk Gera,于20世纪30年代末与德国图林根东部的Gera的电容器制造商建立了紧密的合作。自此,ELECTRONICON开始崭露头角,专注于电容器技术的研发与生产。公司始终将产品的质量和可靠性作为核心理念,为未来的发展奠定了坚实的基础。

DCD [Digital Core Design]公司的发展小趣事

在市场竞争日益激烈的情况下,DCD公司意识到单打独斗难以取得更大的发展。因此,公司开始寻求与其他企业建立战略合作关系。通过与上下游企业的紧密合作,DCD公司实现了资源共享和优势互补,进一步提升了自身的竞争力。同时,公司还积极参与行业标准的制定和推广工作,为行业的健康发展贡献了自己的力量。

遨格芯微(AGM)公司的发展小趣事

除了在智能手机和IoT市场取得突破外,AGM还深耕工业和消费类市场。公司自主研发并量产的可编程逻辑SoC产品系列广泛应用于工业和消费类市场,满足了客户对高容积率、低成本、高品质的市场需求。通过不断的技术创新和产品优化,AGM在工业和消费类市场逐渐形成了自己的竞争优势,并赢得了越来越多客户的认可和信赖。

问答坊 | AI 解惑

44B0X中文资料.大家支持下

44B0X中文资料.大家支持下…

查看全部问答>

PCB上的模拟地和数字地有什么区别

各位兄台,咨询个问题,PCB上的模拟地和数字地有什么区别?模拟地和数字地接到哪里去?信号地是不是也有讲究…

查看全部问答>

关于eboot的依赖lib的编译

小弟在编译EBOOT的时候发现fulllibc.lib这个库一直找不到在哪里编译出来, 有人试过,依次的编译eboot的所需要的库吗?…

查看全部问答>

VC2005做的pocket pc程序怎么能让界面不在自动全屏?

用vs.net2005中的C++做的pocketpc程序运行后界面总是自动全屏化,该怎么解决?…

查看全部问答>

51单片机串口发送问题

为什么我这样不能发?那个TI不处理我至少应该收到一个啊?                              for(m=0;m…

查看全部问答>

用分立元器件怎样做射频卡?

各位大牛好,我最近参加了学校的电子设计竞赛,做的题目是《RFID打卡器和射频卡设计》,题目要求射频卡不能直接用现成的卡,像Mifare 1k(s50)这样的。从拿到题目到现在几天了,我都没搞懂怎样用分立元件做射频卡 ,恳求大侠们指点一下 。…

查看全部问答>

哪位大侠可以给我完整深入的说一下TMS320F2812,我的毕业设计要用到

哪位大侠可以给我完整深入的说一下TMS320F2812,我的毕业设计做的就是DSP,因为没学过,所以现在用就很吃力。 希望那个大哥大姐帮我一下,越详细越好,一些硬件结构,外部电路,寄存器设置等等,谢谢了。…

查看全部问答>

MDK环境下编译LM3S8962程序出现RL-ARM is not allowed with this license

.\\Obj\\Memory.axf: Error: L9937E: RL-ARM is not allowed with this license, 该问题是没有支持Real-Time OS功能,需要在license中加入这个,如下图所示,就可以正常编译了 [ 本帖最后由 hansonhe 于 2012-3-20 14:06 编辑 ]…

查看全部问答>

STM32由入门到精通2012年3月版

STM32由入门到精通2012年3月版,很值得看看!!!! …

查看全部问答>