历史上的今天
返回首页

历史上的今天

今天是:2025年06月11日(星期三)

正在发生

2018年06月11日 | 会打电话的AI: 即便为真 也不值得大惊小怪

2018-06-11 来源:中国科技网

“语言交互是智能音箱的核心功能。智能音箱的销量剧增,大量的语音交互会带来多样化的数据样本,目前研究界都在试图突破自然语言处理的难关,虽然从事这项研究的人比以前多很多,研究条件也很好,但理论的瓶颈、语言理解的语义鸿沟问题,不是一时半会能解决的。”

近日,谷歌在I/O开发者大会上展示了备受争议的Duplex AI,它通过电话完成了饭馆、发廊的预约,并没被对方“识破”。但过于干净的对话环境,也引发了一些人对于视频真假的争论。

语音合成技术已经可以“以假乱真”?语音交互取得了突破性进展?人和机器可以对答如流?这段展示之后,围观者的惊喜、质疑、担忧纷至沓来。

技术加持 智能音箱爆发式增长

“相对于触摸、按钮等操纵,语音交互直接、方便、快捷。受惠于人工智能行业飞速发展,语音和语义的识别已经愈发准确。”智能设备厂商负责人赵明对科技日报记者表示。技术进步为智能音箱的产品化提供了支撑。

智能音箱的基本功能是为与人类语言互动、播放媒体音频和智能家居提供统一入口,其中语言交互是核心功能。对于用户来说,智能音箱可以用来查询天气、听音乐、进行一些简单问答等。对于厂商来说,智能音箱意义更大:在语音时代,它是重要的流量入口,生产大量数据,并把用户牢牢稳固在自己的生态链上。

从2014年亚马逊的智能音箱Echo面世,这种智能家居产品在过去几年爆发式增长,巨头纷纷入场,智能音箱发展史上的重要产品不断出现:国外的谷歌Home、苹果HomePod、微软Invoke,国内的京东叮咚、联想音箱、喜马拉雅小雅、阿里巴巴天猫精灵、小米小爱同学等。据赵明介绍,全球智能音箱市场规模在过去几年迅速增长,从2015年的255万台到2017年的3000万台。去年中国智能音箱市场达到176万台的销量,销售额4.9亿元,市场潜力明显。

对标Echo 产品功能初级单一

据赵明介绍,作为智能音箱领域的头部厂商,亚马逊通过接入Alexa语音助手以连接其他硬件软件服务,在先发优势和技术壁垒下,已经形成一定业务体系。亚马逊具有深厚的电商基础,并在内容、硬件、平台、云计算、物流仓储等领域布局,通过智能音箱整合软件、硬件、平台及内容资源,进一步盘活电商资源。

“亚马逊Alexa平台及云计算平台为打通多个服务链条奠定了基础,在硬件操作、软件应用及内容观看收听中的海量数据被有效收集并整理,实现内容与服务的个性化。”赵明表示,亚马逊在中文语音识别方面缺少布局,目前没有进入中国市场,但其发展为中国市场提供了借鉴,多数厂商以Echo为对标,布局智能音箱。

但据赵明介绍,目前智能家居行业还处于整体发展的中前期,行业标准尚未形成,巨头之间难以统一的平台标准为智能家居的普及造成了巨大困难。“目前的AI水平较为有限,很多智能家居实现了基本的AI功能,但都比较初级单一,用户使用体验并不理想。”

此外,中科院自动化所研究员王金桥表示,中文语音交互存在更多特殊障碍:中文的方言和口音种类过多,交流非常困难,语义鸿沟难以跨越。“市面上的智能音箱都‘傻乎乎’的,只能用来搜索和问答一些条条框框的问题,无法理解逻辑、上下文关系等,大家买回家玩几天,新鲜劲儿一过就闲置了。全国三百多家智能音箱厂商,没有一家赚钱的。”王金桥说。

灵隆科技CEO魏强也曾对媒体表示,目前消费者普遍反馈智能音箱存在远场识别差、误唤醒率高、连续对话功能不稳定和语义理解能力差、音质不好等问题,看似火爆的智能音箱行业正在面临创新能力弱、产品体验差、内容和技能不足、用户认知度低等诸多挑战。

水平有限 仍是简单场景的人机交互

谷歌演示Duplex AI的过程引发了真实与否的争议:人们注意到,这些通话中的两位女性员工都没有在电话上提到自己公司的名称,另外这两个录音中也都没有环境噪音。不过谷歌并没有对是否编辑过电话录音的问题发表评论。

对于Duplex AI的表现,王金桥表示:“这只是展示了一个效果,不能说机器通过了图灵测试,也不代表理论上的突破。况且真实性没有验证。如果是真实的,那确实是先进的自然语言理解,这说明大家都在往自然语言处理的方向努力。”

思必驰副总裁、语音交互科学家初敏表达了类似的观点。“这个预约的过程难度不大,是一个简单场景的人机交互。只是角色置换了一下,不是我们常见的‘人问机器’,而是‘机器问人’,引发了大家的热议。”初敏说。

初敏表示,谷歌展示的“机器预约餐厅、发廊”一定是可以实现的,没有被对方听出来说明语音合成的效果不错,但整体来看,全程“没有展现有挑战性的问题”——如多任务切换、跨场景、噪音、上下文逻辑理解等。她同样表达了对视频真实性的怀疑:“餐厅听起来应该是乱七八糟的,但视频中没有背景噪音,所以不排除表演的可能。”

要想质变 需要自然语言处理技术突破

自然语言处理是语音交互的核心技术,也是三十年来几乎没有突破的痛点。通俗来说,这项技术就是“让机器理解人”。据王金桥介绍,自然语言处理的核心是理解,希望机器能理解人的语言和目的。但每个人都是个性化的,说话的轻重缓急、重音位置,看到夕阳西下时或开心或伤感的个人感受,这些都是目前的机器无法理解的。尤其是在中文语境下,常见的一语双关、倒装、句式简化等,人有时候都理解不了,对机器来说更是难上加难。

初敏表示,在语音交互背后,是语音识别、自然语言理解、对话管理、自然语言生成等诸多环节,各环节充分配合才能实现良好的交互效果。“相比于谷歌展示的预约,我们已经可以处理更复杂的交互,只是效果没那么好。”初敏说。

“机器的认知推理和理解是一个系统的处理工程,是各种复杂算法的结合,不是单项技术能解决的。”王金桥表示。目前比较可行的限定场景下的自然语言处理,比如儿童陪伴、学科细分的语料库,可以实现智能化交互。中国科学院院士谭铁牛也在两院院士大会期间谈到人工智能正处在从“不能用”到“可以用”的技术拐点,距离“很好用”还有诸多瓶颈。“像‘那辆白车是黑车’‘能穿多少是多少’一类的表述,机器无法准确理解和翻译。”谭铁牛说。

语言交互是智能音箱的核心功能。智能音箱的销量剧增,大量的语音交互会带来多样化的数据样本,“目前研究界都在试图突破自然语言处理的难关,虽然从事这项研究的人比以前多很多,研究条件也很好,但理论的瓶颈、语言理解的语义鸿沟问题,不是一时半会能解决的。”王金桥说。

推荐阅读

史海拾趣

Amidon Associates Inc公司的发展小趣事

由于Amidon Associates Inc并非一个广为人知的电子行业公司,我无法提供关于该公司的具体发展故事。此外,撰写五个详尽且真实的故事需要详细的公司内部资料,这超出了我的能力范围。不过,我可以提供一个通用的框架,你可以根据这个框架来构建关于一个电子行业发展起来的故事。

故事框架示例

故事一:技术创新引领发展

Amidon Associates Inc自创立之初,就致力于电子技术的研发与创新。公司创始人XXX凭借其深厚的电子工程背景,带领团队开发出了一款具有划时代意义的电子产品——[产品名称]。这款产品以其卓越的性能和独特的设计,迅速在市场上占据了一席之地。随着技术的不断迭代,公司又推出了一系列衍生产品,逐步巩固了在行业内的领导地位。

故事二:市场拓展与战略合作

随着产品线的不断丰富,Amidon Associates Inc开始积极拓展国内外市场。公司通过与大型零售商建立合作关系,将产品推向更广泛的消费者群体。同时,公司还积极寻求与其他电子企业的战略合作,共同开发新技术和新市场。这些合作不仅带来了丰厚的利润,也提升了公司在行业内的知名度和影响力。

故事三:人才培养与团队建设

Amidon Associates Inc非常重视人才培养和团队建设。公司定期举办内部培训和技术交流活动,提升员工的技能水平和团队协作能力。此外,公司还积极引进外部人才,吸引了一批业内精英加入。这些优秀的人才为公司的发展提供了强大的智力支持。

故事四:品质管理与品牌建设

品质是Amidon Associates Inc的生命线。公司建立了严格的质量管理体系,从原材料采购到生产过程控制,再到产品检验和售后服务,都严格按照标准进行。同时,公司还注重品牌建设,通过广告宣传和公关活动提升品牌形象。这些努力使得Amidon Associates Inc的产品在市场上获得了良好的口碑和信誉。

故事五:社会责任与可持续发展

作为一家有社会责任感的企业,Amidon Associates Inc始终关注环境保护和社会公益事业。公司积极采用环保材料和节能技术,减少生产过程中的污染排放。同时,公司还参与多项社会公益活动,为社会的发展贡献自己的力量。这些举措不仅提升了公司的社会形象,也为其可持续发展奠定了坚实的基础。

请注意,以上故事是基于一个假设的框架构建的,并非关于Amidon Associates Inc公司的真实故事。如果你需要关于该公司的具体故事,建议查阅相关资料或联系该公司进行了解。

GS Technology公司的发展小趣事
荧光材料在受到电子束或电流激发时会发光。在显示器中,这些电子束或电流由电路控制,以形成图像或显示信息。
北京人民电器厂公司的发展小趣事

随着北京人民电器产品的不断优化和升级,其生产的GM系列直流断路器在发电、输变电系统中得到了广泛应用。众多电力企业和项目都选择了北京人民电器的产品,这不仅是对其产品质量和技术水平的认可,也进一步推动了公司在电力行业的深入发展。

博通集成(BEKEN)公司的发展小趣事

为了加快市场拓展和技术创新步伐,博通集成积极寻求与产业链上下游企业的战略合作。公司与多家知名企业建立了紧密的合作关系,共同推动无线通讯技术的发展和应用。通过战略合作,博通集成不仅获得了更多的市场资源和技术支持,还实现了与合作伙伴的共赢发展。

Eagle-Picher公司的发展小趣事

进入21世纪后,Eagle-Picher公司迎来了新的发展机遇。2017年,OMGroup斥资1.7亿美元收购了Eagle-Picher公司,这一举措为Eagle-Picher注入了新的资金和资源。在新的资本支持下,Eagle-Picher加大了在电池技术领域的研发投入,不断推出新的产品和解决方案。同时,公司也积极拓展国际市场,与全球多家知名企业建立了合作关系。这些新的发展机遇为Eagle-Picher的未来发展奠定了坚实的基础。

Datalogic公司的发展小趣事

2005年,Datalogic收购了美国PSC公司,这一收购对公司在电子行业中的发展具有重要意义。PSC公司是一家在自动识别领域有着丰富经验和技术积累的企业,其产品线与Datalogic高度互补。通过整合PSC公司的技术和资源,Datalogic进一步巩固了其在电子行业中的领先地位。

问答坊 | AI 解惑

TSC 7107cpl

各位 高手,在下 寻找有关TSC 7107cpl  /  8729BK   资料。用于连接着3位显示数码管的驱动 找到了 英文资料。。。 http://www.alldatasheet.com/view.jsp?Searchword=7107CPL http://www.alldatasheet.com/datash ...…

查看全部问答>

如何进行汽车电子系统中的处理器选择

汽车正经历着一场数字革命的洗礼:纯机械系统和模拟电子的时代一去不复返。现今的汽车是数字化的汽车,内置了几十甚至上百个嵌入式处理器,它们通过数字网路相互连接,以控制和优化汽车内几乎每一个系统的运转。将来的汽车会集成更多的处理器,因为 ...…

查看全部问答>

车载用加速度传感器市场分析

矢野经济研究所预测2008年度消费类加速度传感器市场将比上年增长30.8%,达到2亿7450万个。车载用加速度传感器将比上年增长12.2%,达到 2亿8230万个。这样,消费类加速度传感器和车载用加速度传感器的个数将接近同等规模。另一方面,预计角速度传感 ...…

查看全部问答>

S3C6410开发板的WinCE6.0中Romimage.exe的BUG

WinCE6.0的Romimage.exe依然存在BUG,跟WinCE5.0一样。当新建的工程和PB的安装目录不在同一分区时就不能正确生成nb0文件。本以为WinCE6.0已经解决这个问题,不想饱汉不知饿汉饥,他们似乎没有发现这个BUG,也就不可能修复了。      ...…

查看全部问答>

怎么在芯片手册里面找不到端口控制寄存器地址呢?

怎么在芯片手册里面找不到端口控制寄存器地址呢? ------------------------------------------------ Address Name Description Access 0xE002C000  PINSEL0  Pin function select register 0  ...…

查看全部问答>

【原创】请问如何实现片上256Bflash作为掉电数据保存

怎样实现F149片上的256字节flash作为掉电数据保存字节。读写方法和程序flash一样吗…

查看全部问答>

链接错误!帮忙看看

编译通过了,但是链接时显示下面错误 error[e46]: undifined external "main"referred in cstartup 还望高人提醒一下…

查看全部问答>

一步步教你在CCS下使用TI Stellaris DSP 库

首先,创建一个新的工程,如图所示 [ 本帖最后由 hansonhe 于 2012-2-17 00:54 编辑 ]…

查看全部问答>

OK6410新手学习心得(一)Linux中加入led驱动及测试程序详解

51单片机我们在大学都学过,51也是我们一个嵌入式接触的第一个处理器,它的结构不算复杂。我们学习51单片机,我们可以清楚的说出51单片机中的资源,累加器A和B,程序状态寄存器,程序计数器,6个中断源,r0-r7工作寄存器等等,其实arm处理器也可以 ...…

查看全部问答>

RENESAS FLASH PROGRAMMER下载步骤

第一步:打开RENESAS FLASH PROGRAMMER,截图如下:第二步:若有之前打开创建的工程,第二项中会出现这个项目位置,新工程的话选择第一个 create new workspace,选择basic mode,点击next进入下一步:第三步:选择microcontroller类型,此处选择RL78 ...…

查看全部问答>