历史上的今天
今天是:2025年03月29日(星期六)
2018年03月29日 | 谷歌正在研究能够让计算机合成语音更加自然的技术
2018-03-29 来源:电子产品世界
3月28日,据国外媒体报道,谷歌研究院正在探索让机器合成语音更加自然的方法。谷歌大脑和机器感知团队的成员本周二在博客中公布了一些能让语音更具有表现力的方法示例。下面就随网络通信小编一起来了解一下相关内容吧。
同时,谷歌发布了“云端文本转语音”服务的测试版,提供了与谷歌助手同样的语音合成服务。该服务采用了DeepMind的WaveNet技术,这个技术可以被用于生成非常自然的声音。
谷歌正在研究能够让计算机合成语音更加自然的技术
有报道显示,谷歌研究员近期发表了两篇论文,提出了新的发音方法,介绍了如何模仿语音中的重音或语调。这两篇论文的技术都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系统,使用神经网络进行训练,模仿人类语音。
Tacotron在大部分情况下都可以模拟真人声音,但是却无法模仿说话中的重音和自然语调。Tacotron的联合发明人Wang Yuxuan参与了其中一篇论文研究。研究通过将人类语音片段嵌入计算机语音风格,使合成语音中实现了重音等效果。另一篇论文的研究则使用无监督训练和识别语音模式,并模仿某些语音风格。
在语音技术研发上,去年苹果Siri被众多消费者认为是更加具有表现力的声音。同时去年四月,亚马逊Alexa面向语音应用开发者提供了SSML标签,在语音助手中增加了更丰富的表达,例如停顿、轻语,以及一些感叹词等。
以上是关于网络通信中-谷歌正在研究能够让计算机合成语音更加自然的技术的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。
史海拾趣
|
Liz没有想到,“兔死狗烹”的古老典故会在她身上上演——在协助公司裁掉了100多名员工后,她自己也收到了解聘通知。 Liz原是上海一家韩资网游公司的HR(人力资源专员)。网游本属于反经济周期产业,但不幸,公司没能把握好机会,老的游戏生命力下 ...… 查看全部问答> |
|
(六) 什么是中断呢?讲个比较通俗的例子:比如你正在家中看电视,突然电话响了,你的第一反应是什么?是不是先跑过去接电话!接完电话 后,继续看电视。这就是个中断的例子,中断是由电话引起了,你跑过去就是响应中断,接电话 ...… 查看全部问答> |
|
要做个智能充电器,但是程序部分有个声明叫#define _BATTCHARGER_H,编译后说这个文件不存在。。。哪位高手知道该怎么办。… 查看全部问答> |
|
1、收入 LW收入一般5~10 万美元每年,居各行中等偏上水平;国内,大家都各有千秋,但相比其它行业,也差不多是中等偏上吧; 2、工作 LW工作很认真负责,工作时间不会从事无关的事情;国内,大家都能做到吗? 3、休息 &nb ...… 查看全部问答> |
|
请问如何通过PCI2040来选择DSP以及HPIC HPIA HPID 呢?应该具体对哪个PCI中的寄存器操作才可以达到这些目的呢?在网上没有看到明确的说明。看到文档说是PCI_AD14 PCI_AD13是选择DSP的。PCI_AD_12 PCI_AD11是选择寄存器的。可是那些不是管脚么?应该 ...… 查看全部问答> |
|
我现在作的是PC机与下位机(平台WinCE 5.0)之间的串口通信,两机都只有一个串口 COM1,两边都能发送成功,下位机接收不到消息,PC机每次只能接收2个字节,而且 还是乱码,即 fReadState=ReadFile(m_pSerial->m_hComm,buf,m_pSerial->m_nBufferSiz ...… 查看全部问答> |
|
现在正在做多机通讯,地址需要用2个字节来表示,请问各位大虾,单片机如何去响应这两字节的地址字符了?谁有这方面的源程序啊?给我看看,感激不尽!!!!… 查看全部问答> |
|
#include #define pwm_sf 200 #define pwm_vf 1000 void pwm_sinit(unsigned char pwmvalue1) { TACTL = TASSEL_2 + MC_1; CCR0 = 1002000/pwm_sf; CCTL1 = OUTMOD_7; ...… 查看全部问答> |




