历史上的今天
今天是:2025年05月13日(星期二)
2019年05月13日 | DeepMind强大:用神经网络来生成音频
2019-05-13 来源:爱集微
大名鼎鼎的AlphaGo想必大家都很熟悉吧,而开发他的公司就是DeepMind,作为Google旗下AI明星公司,DeepMind于18年公开了12项AI专利申请,真是让人叹为观止!
DeepMind公布的其中一项专利,就是在某个位置或计算机上实现为计算机程序的系统如何能够生成包括在多个时间步骤中的每一处的相应音频样本的音频数据序列(申请号:PTC/US2017/050320)。
正如 DeepMind 著名的 Wavenet 论文所表明,神经网络也可以应用于处理音频。
神经网络是机器学习模型,它使用非线性单元层来预测所接收的内容。除了输出层之外,还可能有隐藏层。每个隐藏层输出内容成为下一层的输入,即下一个隐藏层或输出层。
网络的每个层根据相应内容从接收的输入生成输出,如图1所示示例神经网络系统。

由一个或多个计算机实现的神经网络系统被配置为生成音频数据的输出序列,该输出序列包括在多个时间步长中的每一个点的相应音频样本。同时,神经网络系统包括卷积子网,其包括一个或多个音频处理卷积神经网络层和输出层。
卷积子网可以被配置为:
1. 对于多个时间步骤中的每一个:在输出序列中的时间步骤之前的每个时间步骤都接收包括相应音频样本的当前音频数据序列。
2. 处理当前音频数据序列以生成时间(当前)步骤的替代表示。
如图2所示。

输出层可以被配置为,对于多个时间步骤中的每一个:接收时间步长的替代表示,并且处理时间步骤的替代表示以生成定义多个可能音频上的分数分布的输出。
卷积神经网络层可以是:
1. 因果卷积神经网络层;
2. 多个堆叠的扩张卷积神经网络层块;
3 .一个或多个可以具有门控激活单元。
调节输入可以是全局的或本地的,而且可以包括例如文本,图像或视频数据或音频数据。
图3所示为用于在音频序列中的给定时间步长处生成音频样本的示例过程的流程图。

如上所述的神经网络系统可以每秒生成数万个音频样本的量级,提供比其他基于神经网络的音频生成系统更高的粒度级别。而且在音频生成任务上明显优于现有技术,且同时不需要与其他系统一样多的计算资源训练,从而缩短了培训时间。
通过采用卷积层而不是循环层,神经网络系统的计算可以更容易地批量化并且更容易并行化。另外,通过采用扩张的因果卷积层,可以改善卷积子网的接收场,并因此改善系统产生的音频的质量,而不会大大增加产生音频的计算成本。
DeepMind作为一家顶尖的人工智能研究公司,其申请的专利具有广泛性,所以也具有重大意义。这些申请并没有明显透露商业化产品或企图,而是意在涵盖广泛的人工智能技术。
史海拾趣
|
DSP的内部指令周期较高,外部晶振的主频不够,因此DSP大多数片内均有PLL。但每个系列不尽相同。 1)TMS320C2000系列: TMS320C20x:PLL可以÷2,×1,×2和×4,因此外部时钟可以为5MHz-40MHz。 TMS320F240:PLL可以÷2,×1,×1.5,×2,×2.5,×3, ...… 查看全部问答> |
|
MOS管作为电源开关,控制给集成电路供电。漏极接电源,源极接到负载的VDD,通过栅极来控制。这样应用可以吗? 好像一般的应用是电源先接到负载的VDD,负载(我这儿的负载是集成电路)的低再接到MOS管的漏极,MOS管的源极接地。当然还是通过栅极加电 ...… 查看全部问答> |
|
1.通过查看WINCE的句柄,得到com1与com2的信息如下: [HKEY_LOCALMACHINE/drivers/BuildIn/Serial] (Default): (value not set) Dll: com165550.Dll Tsp: Unimodem.dll IoBase: 2926575616 Irq: 19 IoLen: 36 DeviceArrayIndex: 0 ...… 查看全部问答> |
|
我在看关于nand flash的代码,其中一部分如下: static struct mtd_partition partition_info[] = { { name: &n ...… 查看全部问答> |
|
我用PB6+VS2005做CE系统. 发现有一个问题. 在common.bib中 ; @CESYSGEN IF CE_MODULES_USBSER usbser.dll $(_FLATRELEASEDIR)\\usbser.dll &nb ...… 查看全部问答> |
|
LINK : fatal error LNK1104: cannot open file \'mfcs42d.lib\' 我的这个lib是在C:\\WINCE500\\OTHERS\\MFC\\LIB\\X86的路径下,我把此路经包含进tools-options后,仍然有错, 请问这是为什么? 如果我在PB下生成的emulator中没有加入mfc,是 ...… 查看全部问答> |
|
有没有windows XP Embedded ? 有没有相关的学习资料和开发板卖?价格大概多少? 强烈要求把wince作为一个主论坛!… 查看全部问答> |
|
香板,帮忙确认一下STM8L-Discovery无法连接调试 新购买的10pcs STM8L Discovery无法使用在板的STLink连接调试。 操作系统试过Windows 7 专业版、Windows XP,一共5台计算机都无法调试,但有台计算机使用Windows 7家庭版可以连上调试。 在出问题的计算机上软件使用过STVD 4.2、STVP3.22都无 ...… 查看全部问答> |
|
分析看了下这块板子,只有D2,L3~L8共7个指示灯程序可控,便想着使用这7个指示灯做个游戏程序。 这样的开发板不增加外设的情况下最适合玩打地鼠吧,L3~L8对应电脑按键QAZWSX吧,通过虚拟的232串口与开发板连接。 初步目标是每2秒随机出一只地鼠, ...… 查看全部问答> |




