历史上的今天
返回首页

历史上的今天

今天是:2024年12月13日(星期五)

正在发生

2018年12月13日 | 依图科技+华为发布“智能语音联合解决方案”

2018-12-13 来源:eefocus

人工智能公司依图科技公布了在中文语音识别技术上的最新突破。在全球最大的中文开源数据库AISHELL-2中,依图短语音听写的字错率(CER)仅为3.71%,相比原业内领先者提升近20%,大幅刷新现有纪录。

 

除了傲人的成绩之外,此次依图还得到两家巨头企业的共同“点名”。其一,是与当前市值最高的企业微软Azure联合推出依图语音开放平台;其二,是携手“通信巨头”华为,发布“智能语音联合解决方案”。

 

依图首席创新官吕昊博士

 

近年来,深度学习的爆发驱动了语音识别技术的高速发展,但相较于人脸识别在准确率方面的高增速来说,语音识别的发展仍较为缓慢。尽管一些机构已宣传达到了人类水平,但大多数情况下都来自安静、近场等受限场景。对于电话、语音节目、远场等更复杂场景,理想和现实仍有较大差距。而在中文语音识别技术领域,汉语的博大精深带来的同音不同意等问题,更对语音识别的处理难度带来极大挑战。

 

依图首席创新官吴昊博士表示,“语音识别技术经历了漫长的发展进化,但至今都只能在受限的场景下才能达到较好的使用效果。我们认为,核心技术的突破,依然是当前破局中文语音识别发展的关键。在语音识别领域,依图科技是一名新生,但立志推动行业创新与发展,做世界最好的中文普通话语音识别技术。”

 

依图此次推出的中文语音识别算法,与业内原有领先者相比,不仅大幅提升了识别准确率,且在单个算法模型上,有极为出色的多场景适用性表现。在业内近期公开的AISHELL-2的三个测试子集,以及来自第三方的近场口音测试集、近场安静聊天测试集、语音节目测试集、电话测试集、远场测试集中,依图均处于业界领先水平,且字错率全部在15%以下。其中,在AISHELL2-2018A-EVAL数据集中,依图的识别准确率高达96.29%,字错率(CER)仅为3.71%,领先行业第二名约20%。通过“听写大会”微信小程序,让用户可以直观感受到语音识别技术的真实表现,在业界也属首次,公开透明的体验各类算法的水平差异。

 

 

 

语音识别是人人交互、人机交互最重要的入口,这也让语音识别成为是各大企业必争的互联网入口级技术。当前如火如荼的语音输入法等应用,以及智能音箱、智能机器人,以及智能家居等智能硬件,都是市场规模极为庞大的典型应用场景。据市场调研机构Tractica统计,2017年全球语音和语音识别软件市场规模达到11亿美元,而在2025年,这一数字预计将达到69亿美元。

  

因此,从行业巨头到新创公司,都在积极部署语音识别技术。而面对大量终端设备所产生的海量数据,在云端部署人工智能成为当下的主流方式。一方面,针对庞大的开发者需求,基于云服务来构建开放平台,才能够推动行业生态。另一方面,企业需要在云端部署高性能的服务器系统,才能够满足大量终端设备的语音处理请求。

 

作为目前全球市值最高的企业,微软在云端业务方面的高速增长,成为其发展的重要驱动力。在微软2019财年第一财季的财报中显示,Azure云业务的营收同比增长达76%。当前,微软也正将人工智能作为Azure发展的一大核心方向。微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士曾表示,“Azure是人工智能最佳的云平台,许多开发者和企业已经利用它创造出许多奇妙的应用。”

 

 

依图科技+微软联合发布依图语音开放平台


此次依图与微软深化合作,基于微软Azure云,联合推出依图语音开放平台,可以看作是在最好的人工智能云平台上,将行业领先的语音识别技术能力开放给广泛的第三方应用开发者。而在联合发布语音开放平台之后,依图与微软还将在智能语音领域展开更深层次的合作,共建AI生态。

 

依图与华为联合发布的“智能语音联合解决方案”,基于依图语音开放平台及华为全栈全场景昇腾(Ascend)系列芯片和面向数据中心侧的Atlas 300 AI加速卡,将双方强大的技术研发能力与生态服务能力深度结合,形成软硬件一体化的联合解决方案。借助该解决方案,第三方应用开发者可进一步提升开发效率,从业界领先的语音技术中受益。

 

Atlas是华为新一代智能云硬件平台,可以助力企业加速智能化进程,不仅可为AI应用带来强大的算力支持,更能提供完整的AI解决方案,真正让AI“跑在云上”。此次合作,可以透过软硬件的深度融合,加速企业对依图语音识别技术的云端部署,快速构建能够提供行业领先智能语音技术服务的基础设施。

 

 

依图科技+华为发布“智能语音联合解决方案”


语音识别是人工智能理解世界最重要的组成部分。依图预计,在未来6个月到12个月,语音识别技术的算法性能将呈指数级增长,随之带来的是对云端处理的巨大需求。此次依图与微软、华为的合作,有力推动了依图智能语音技术在云端平台的构建,形成智能语音云端联盟,为解锁新场景、赋能新应用提供坚实的基础设施,从而撬动数十亿美元的市场。


推荐阅读

史海拾趣

CINTERION公司的发展小趣事

CINTERION的前身可追溯到西门子于1995年创建的无线模块业务。在成立之初,该公司便专注于工业用机器对机器(M2M)无线通信模块的研发与生产。随着技术的不断进步,CINTERION逐渐在行业内崭露头角,其产品在智能电网、汽车、公用事业等领域得到了广泛应用。1996年,CINTERION成功推出了全球第一款蜂窝模组,这一创新为公司在无线通信模组市场打下了坚实的基础。

Dynex公司的发展小趣事

近年来,CINTERION与泰雷兹达成战略合作,共同推出了创新型物联网无线通信模组Cinterion MV32。这款模组结合了泰雷兹在连接管理方面的灵活性和CINTERION在无线通信模组技术上的优势,为制造商提供了快速构建和维护高性能5G设备的解决方案。这一合作不仅加强了CINTERION在物联网领域的市场地位,也为其在未来的发展中注入了新的活力。

以上五个故事均基于CINTERION在电子行业中的发展历程和成就进行描述,旨在客观呈现其在不同领域的发展轨迹和技术实力。

API Technologies公司的发展小趣事

API Technologies一直注重技术创新和研发投入。公司不断引进先进的生产设备和技术人才,加大对新产品、新技术的研发力度。通过不断的技术创新,API Technologies成功推出了一系列具有自主知识产权的高性能产品,不仅提升了公司的核心竞争力,也为公司的持续发展注入了新的动力。

聚辰(Giantec)公司的发展小趣事

在快速发展的同时,港源公司始终不忘履行社会责任。公司秉承绿色环保、节能减排的理念,在生产经营活动中以预防为主、全员参与为行动纲领,防治污染、节废减排。港源公司选用绿色环保RoHS材料,严格管控生产制造过程,确保生产出的产品符合国际环保标准。此外,公司还积极参与社会公益活动,为社会和谐发展贡献自己的力量。

BTCPower公司的发展小趣事

在面对行业竞争加剧和市场需求变化的挑战时,BTCPower展现了出色的危机应对能力。公司及时调整战略和业务结构,开始向智能家居、物联网等新兴领域拓展业务。通过不断创新和转型,BTCPower成功度过了危机,并迎来了新的发展机遇。

这些故事基于电子行业常见的情境和趋势进行虚构,旨在满足您的需求。请注意,这些故事并非真实事件,也不代表任何真实公司的经历。

Hitachi (Renesas )公司的发展小趣事

在面对行业竞争加剧和市场需求变化的挑战时,BTCPower展现了出色的危机应对能力。公司及时调整战略和业务结构,开始向智能家居、物联网等新兴领域拓展业务。通过不断创新和转型,BTCPower成功度过了危机,并迎来了新的发展机遇。

这些故事基于电子行业常见的情境和趋势进行虚构,旨在满足您的需求。请注意,这些故事并非真实事件,也不代表任何真实公司的经历。

问答坊 | AI 解惑

dsp论文系列

现在越来越火爆的,比起单片机来,功能是强大不少,看看现在都研究些什么?不过主要是关注电机控制这一块,其他的了解不是很多,发几个不同领域的看考一下! …

查看全部问答>

对于员工上班迟到你是如何管理的?

员工迟到,影响团队效率。怎样有效管理,杜绝员工迟到,做为管理者应该出些啥招?…

查看全部问答>

20针的ISP口定义谁有啊??!!

各位大师: 20针的ISP口定义谁有啊??!! JTAG 协议的20和其它协议的定义是否大同?    SCI 协议  ?????     ICC 协议????? [ 本帖最后由 wanzsxit 于 2010-7-27 19:00 编辑 ]…

查看全部问答>

D:\WINCE600\PUBLIC\DIRECTX\SDK\SAMPLES\ddraw\src\DDex1怎么编译成DDex1.exe?

wince6.0下DDraw的sample应用程序 如题:D:\\WINCE600\\PUBLIC\\DIRECTX\\SDK\\SAMPLES\\ddraw\\src\\DDex1怎么编译成DDex1.exe? sources中编译为.lib,在命令行中输入: cd D:\\WINCE600\\PUBLIC\\DIRECTX\\SDK\\SAMPLES\\ddraw\\src\\DDex1 b ...…

查看全部问答>

位图操作。获取DIB后对其数据进行操作实现旋转!!!!

总算找到组织了!! 我最近在学习EVC下的位图操作。要实现位图的快速旋转。看了很多网上资料,很多事对DC中的像素进行操作的,实现的过程都很慢很慢,项目部能接受。 后来看到一些人说对DIB进行操作很快的实现,于是就模仿了一下,比像素操作时快 ...…

查看全部问答>

请教一个短信发送时的拦截

MTK平台上可不可以 拦截短信发送的事件。例如 我发送一条短信,但是希望在发送出去之前拦截这个发送短信的动作。请大家讨论下。…

查看全部问答>

关于6410把内存从128改为512或者更大?散分!!!!!!

现在6410跑的是128M的内存,现在想改为512M。系统为wince6.0。 wince6.0最大支持多大的内存? 如果要改内存,需要修改那些部分?能否说的清楚一点。 高手指点!!…

查看全部问答>

驱动程序如何读取端点0的缓冲?

假设现在在固件中已经设定了端点0, 如EP0BUF[0]=0XFF; 在驱动程序中怎么读取它呢?谢谢…

查看全部问答>

汇编程序除法问题

                                 小弟现遇到一个汇编程序的除法问题,用一个16位二进制数除以一个8位二进制数,不知道怎么实现。具体内容是我要计算 ...…

查看全部问答>