历史上的今天
返回首页

历史上的今天

今天是:2025年03月15日(星期六)

2018年03月15日 | 人机交互新蓝海——语音合成

2018-03-15 来源:亿欧网

当今很多可以接触到人工智能产品并应用场景,如:智能家居、智能机器人、智能音箱、虚拟偶像、有声读物、教育行业等等。无论是放在家里还是郊游场景,曼妙的合成音好像已经成为一个新的人物IP,虽然有时候还是不够聪明,但是很多电子发烧友愿意给予更多的耐心,并且逐渐把他们物化成生命中的伙伴。

在大家过瘾的背后,却是产业链条的从业者推动着细微点滴的进步,日积累月,方可见今日之成果。

关于身边的智能音箱背后技术链条你知道多少?

首先我给大家普及一下智能音箱这种新兴的交互方式由哪些技术模块给予支撑的?语音交互过程分为信息输入、信息处理和信息输出三步,相对应的技术便是语音识别、语义分析(自然语言处理)和语音合成。

知识点1:语音识别和语义分析早成红海咯

过去几年,语音识别一直是社会关注的热点,科大讯飞和搜狗在识别准确率上你追我赶;语义分析里的自然语言处理技术也得到了大规模商业化应用,各种智能客服、聊天机器人如雨后春笋般出现,可是唯独语音合成技术无人问津,显得格外冷门。

但是,2018年以来,语音合成市场需求激增。据资深人士说:“很多从事做语音识别的大牛现在转型做语音合成。以一些公司为例,她之前对合成的重视程度不是特别高,但从去年开始,重心逐渐转向合成”。

知识点2:语音合成新蓝海,你是不是又错过了?

语音合成又称文语转换,指通过机械的、电子的方法产生人造语音的技术。过去语音交互市场环境是很多年企业都在做识别,对合成的关注不多。但现在很多领域对声音的合成效果要求越来越高,比如各类智能玩具、家电等都要语音交互。

简而言之,以前的声音只要能用就行,现在随着个性化产品的丰富,更好的展现产品的应用场景和用户体验。定制化的需求越来越高,声音出来之后产品和场景有较好的契合度。

纵观国内语音合成市场,科大讯飞、百度、捷通华声等巨头早已推出语音合成开放平台,提供标准化服务。缪冠琼认为,标准化的服务难以满足个性化的需求,尤其是对于中小企业。

知识点3:标贝科技因为专注,所以ALL IN

作为语音产业链的中游企业,标贝科技的客户来源能很好反映市场环境。缪冠琼介绍,标贝科技客户有两类:一类是大公司,他们一般有能力做合成技术研发,但是欠缺数据,需要找我们来做;另一类是中小企业,今年以来中小企业的定制化服务比较旺盛。他们除了缺数据,算法也没有能力来做(因为研发的成本非常高,有经验的开发人员也非常难找),标贝科技为其提供系统化解决方案。

值得一提的是,标贝科技不仅有合成技术,还有超长自有语音库。据了解,在TTS前端训练集方面,标贝拥有15万句以上韵律训练集,15万句以上分词词性训练集,15万句以上多音字训练集以及10万句TN训练集。

目前,标贝科技已为百度、腾讯、滴滴、搜狗、Rokid、暴风集团、出门问问、Roobo、喜马拉雅FM、猎豹移动等众多客户,建立了长期稳定的合作关系。

你以为语音合成就这么简单吗?答案:NO

标贝科技在完成语音数据产品交付后,服务才刚开始,有一把好的剑,也需要一流的剑客才能用好。语音数据产品在交付后,客户还需要做一些调试和完善,但这个过程如果处理不好,往往让产品体验效果大打折扣。而客户也纳闷:到底是哪里出了问题呢?标贝科技还在充当着指导剑客如何使用好剑的老师傅。

“老师傅”标贝科技近日发布的TTS(语音合成应用的一种)评测系统,正为客户解决这类头痛的问题。

通俗来讲,TTS系统可分为前端和后端两部分,前端完成输入文本的归一化、分词、发音预测、韵律结构预测的处理;后端对声音建模,通过学习得到声音参数合成声音。由于自然语音本身的复杂性和开放性,前端处理部分难度大,需覆盖面广,导致该部分一直是语音合成领域的重点和难点。

具体而言,标贝科技评测系统主要分为三大模块,客观评测、评分评测和综合评测。

1、合成客观评测主要体现为合成系统前端的韵律、多音字、数字符号及分词词性四个模块;

2、合成评分评测,本评测模块以代表不同的TTS用户群体的评测人员,分别以横向和纵向两种不同的方式对TTS合成系统的语音进行评分。目的在于让用户了解自身TTS系统的可优化空间及市场竞争力;

3、综合评测,通过对合成测试集10个领域的样本进行深入分析,从文本分析问题、韵律层级预测问题、声学参数生成问题和声码器问题等方面,对合成系统进行全面综合的剖析,形成评测报告。评测报告分两部分:第一部分是机器合成生成的,用户下载测试集之后,可生成一个在线的检测结果;第二部分是更深度的人工评测。目前全部是免费评测。用户通过评测,可以更深入地了解合成系统的关键问题所在,更高效地达到提升系统合成效果的目的。

估计你读到这里大概知道一只流畅对话的智能音箱来之不易,尽管我们今天只是介绍了第三部分语音合成的标杆性企业标贝科技新产品的TTS测评系统,你仍然能够感受到语音交互是未来,而这种未来是建立在成千上万的研发人员,工程师、以及语音数据服务商日夜耕耘的基础上,他们对你说讲的每一句都悉心听取,他们对你的每一次语音交互都抱着期待的希望,他们对你的每次语音合成再现优质体验都全力以赴...

推荐阅读

史海拾趣

ARCOTRONICS公司的发展小趣事

ARCOTRONICS公司一直将产品质量视为企业的生命线。公司建立了严格的质量管理体系,从原材料采购到生产过程的每一个环节都进行严格把控。同时,公司还注重售后服务,为客户提供及时、专业的技术支持和解决方案。这些举措使ARCOTRONICS公司的产品赢得了客户的广泛信赖和好评。

ABL Aluminum Components公司的发展小趣事

随着技术的成熟,ABL公司开始积极拓展市场。公司通过与大型电子产品制造商建立合作关系,将其铝合金组件应用于更广泛的领域。同时,ABL公司也注重品牌建设,通过参加行业展会、发布技术白皮书等方式,提升公司在业内的知名度和影响力。随着市场份额的逐步扩大,ABL公司逐渐成为了电子行业铝合金组件领域的领军企业。

Azoteq公司的发展小趣事

随着触控技术的兴起,Azoteq在2004年增加了第二条产品线,以应对新兴的电容式触摸和接近感应产品市场。这一举措使得Azoteq能够紧跟市场趋势,为客户提供更多样化的产品选择。通过不断的技术创新和市场拓展,Azoteq在这一领域逐渐取得了领先地位。

GE公司的发展小趣事

近年来,Azoteq在传感技术方面取得了重大突破。其最新产品系列——ProxFusion®,是世界上第一个单芯片集成多传感器功能的解决方案。这一创新产品将多种传感功能集成在一个芯片上,为客户提供了更加便捷、高效的解决方案。ProxFusion®的推出,再次展现了Azoteq在传感技术领域的领先地位。

CommScope Inc公司的发展小趣事

随着通信行业的快速发展,康普公司意识到光纤光缆在有线电视行业的重要性。因此,在1977年,康普公司合并了Valtec公司,一个独立的光纤技术领导者。这次合并不仅增强了康普在光纤技术方面的实力,也为其日后的全球化布局打下了坚实的基础。随后,康普通过一系列的战略合作和收购,逐渐在全球范围内建立了供应链和生产基地,为全球客户提供高效、可靠的通讯网络解决方案。

Elma Electronic Inc公司的发展小趣事

Elma在美国和美洲拥有广泛的客户群,覆盖电信、工业控制、医疗电子、国防和航空航天等多个行业。其产品线包括外壳、背板、系统平台、机柜、高品质开关和编码器等多种零件,能够满足不同行业客户的多样化需求。这种跨行业的布局使得Elma能够在多个领域保持竞争力。

问答坊 | AI 解惑

电位计式扭矩传感器

电位计式扭矩传感器 电位计式扭矩传感器主要可以分为旋臂式、双级行星齿轮式、扭杆式。其中扭杆式测量结构简单、可靠性能相对比较高,在早期应用比较多。 EPS中扭杆式扭矩传感器的结构、原理 扭杆式扭矩传感器主要由扭杆弹簧、转角-位移变换器、 ...…

查看全部问答>

现在流行拆充电器,我也秀一个看看

看到许多论坛上好多人拆充电器,晚上回家也迫不及待地拆开了一个,呵呵。这个是淘宝上买的,价格忘记了,不到15元吧。我用它给一节锂电池充电,效果还可以。韩国产的,下面让大家看看内部结构 …

查看全部问答>

求助:可综合的verilog代码的若干问题

用verilog写可综合代码,综合后发现功能不对了。想请教一下: 1 可综合的verilog代码中,可以有不同的敏感信号吗?比如可以有多个always语句,有的敏感列表里是时钟上升沿有的是时钟下降沿吗?可以这样吗:    always @(posedge clk) & ...…

查看全部问答>

gcc和armcc有什么区别?

如题??? 一般什么场合会用到ARMCC或GCC呢 …

查看全部问答>

怎样让CE不进入休眠模式,一直在线运行?

怎样让CE不进入休眠模式?需要改注册表哪一项目?…

查看全部问答>

WINCE中编写了一个基于SIP的输入法该如何调整软键盘界面的大小

WINCE中编写了一个基于SIP的输入法,SIP默认的输入法面板太小,该如何调整软键盘界面的大小?谢谢啊,第一次写书法呵呵。…

查看全部问答>

怎么用cordic算法算sin cos

怎么用cordic算法算sin   cos…

查看全部问答>

【MARKED】C语言中定义全局变量时,如何在定义变量时就指定好变量的地址

本帖最后由 辛昕 于 2018-9-6 22:07 编辑 各位大侠:         小弟新手,请多多帮忙!         小弟现在写一个单片机的程序,由于项目比较紧,就分给两个人做,小弟不懂汇编,要 ...…

查看全部问答>