历史上的今天
返回首页

历史上的今天

今天是:2025年05月13日(星期二)

正在发生

2019年05月13日 | DeepMind强大:用神经网络来生成音频

2019-05-13 来源:爱集微

大名鼎鼎的AlphaGo想必大家都很熟悉吧,而开发他的公司就是DeepMind,作为Google旗下AI明星公司,DeepMind于18年公开了12项AI专利申请,真是让人叹为观止!

DeepMind公布的其中一项专利,就是在某个位置或计算机上实现为计算机程序的系统如何能够生成包括在多个时间步骤中的每一处的相应音频样本的音频数据序列(申请号:PTC/US2017/050320)。

正如 DeepMind 著名的 Wavenet 论文所表明,神经网络也可以应用于处理音频。

神经网络是机器学习模型,它使用非线性单元层来预测所接收的内容。除了输出层之外,还可能有隐藏层。每个隐藏层输出内容成为下一层的输入,即下一个隐藏层或输出层。

网络的每个层根据相应内容从接收的输入生成输出,如图1所示示例神经网络系统。

      由一个或多个计算机实现的神经网络系统被配置为生成音频数据的输出序列,该输出序列包括在多个时间步长中的每一个点的相应音频样本。同时,神经网络系统包括卷积子网,其包括一个或多个音频处理卷积神经网络层和输出层。

卷积子网可以被配置为:

1. 对于多个时间步骤中的每一个:在输出序列中的时间步骤之前的每个时间步骤都接收包括相应音频样本的当前音频数据序列。

2. 处理当前音频数据序列以生成时间(当前)步骤的替代表示。

如图2所示。


      输出层可以被配置为,对于多个时间步骤中的每一个:接收时间步长的替代表示,并且处理时间步骤的替代表示以生成定义多个可能音频上的分数分布的输出。

卷积神经网络层可以是:

1. 因果卷积神经网络层;

2. 多个堆叠的扩张卷积神经网络层块;

3 .一个或多个可以具有门控激活单元。

调节输入可以是全局的或本地的,而且可以包括例如文本,图像或视频数据或音频数据。

图3所示为用于在音频序列中的给定时间步长处生成音频样本的示例过程的流程图。

       如上所述的神经网络系统可以每秒生成数万个音频样本的量级,提供比其他基于神经网络的音频生成系统更高的粒度级别。而且在音频生成任务上明显优于现有技术,且同时不需要与其他系统一样多的计算资源训练,从而缩短了培训时间。

       通过采用卷积层而不是循环层,神经网络系统的计算可以更容易地批量化并且更容易并行化。另外,通过采用扩张的因果卷积层,可以改善卷积子网的接收场,并因此改善系统产生的音频的质量,而不会大大增加产生音频的计算成本。

      DeepMind作为一家顶尖的人工智能研究公司,其申请的专利具有广泛性,所以也具有重大意义。这些申请并没有明显透露商业化产品或企图,而是意在涵盖广泛的人工智能技术。


推荐阅读

史海拾趣

Exar公司的发展小趣事

Exar公司通过收购和兼并多家公司,实现了技术融合和产品线拓展。其中,Neterion和Hifn的收购是Exar发展历程中的重要里程碑。Neterion在万兆以太网数据传输技术和虚拟化IO技术方面处于领先地位,而Hifn则在数据精简、加密、压缩技术方面拥有领先技术。Exar将这两家公司的技术融合在一起,推出了一系列高性能的数据传输和存储产品,进一步巩固了其在行业中的领先地位。

BNS Solutions公司的发展小趣事

在快速发展的过程中,BNS Solutions公司始终注重品质管理和品牌建设。公司建立了一套完善的质量管理体系,从原材料采购到产品生产、销售等各个环节都严格把控质量。同时,公司还注重品牌形象的塑造和维护,通过广告宣传、公关活动等方式不断提升品牌知名度和美誉度。这些举措使得BNS Solutions公司的产品在市场上具有更高的竞争力,赢得了消费者的信赖和喜爱。

Dytran Instruments Inc公司的发展小趣事

随着技术的不断成熟和产品线的不断完善,Dytran开始积极拓展市场。公司不仅在美国本土取得了良好的销售业绩,还通过参加国际展览和建立海外办事处等方式,将产品推向全球。在这个过程中,Dytran的传感器产品得到了众多行业客户的认可,广泛应用于航空航天、工业和汽车行业的产品开发测试和嵌入式监控解决方案。

为了更好地服务全球客户,Dytran在成立两年后将其总部迁至美国加利福尼亚州的查茨沃思市。这里地理位置优越,交通便利,有利于公司进一步拓展北美市场。同时,公司还加强了与全球合作伙伴的合作,共同推动传感器技术的发展和应用。

C.K TOOLS公司的发展小趣事

随着全球电子产业的蓬勃发展,C.K TOOLS开始将目光投向国际市场。他们通过加强在英国、爱尔兰、法国和德国等欧洲国家的销售团队建设,以及扩大在全球其他国家的分销商网络,将产品推向了世界各地。在国际市场上,C.K TOOLS凭借其高品质的产品和专业的服务,赢得了众多电子制造企业的信赖和好评。

Emerson公司的发展小趣事

1954年至1973年,Emerson在总裁帕森斯的领导下,开始实施多元化战略。公司通过一系列并购活动,成功收购了包括威诺、美国电气电机、里奇工具等在内的36家公司,进一步拓宽了业务范围。同时,Emerson还注重研发和创新,通过不断推出新产品和技术,巩固了其在电气行业的领先地位。在此期间,公司的规模迅速扩大,从最初的2家工厂、4000名员工和5600万美元产值发展到82家工厂、31000名员工和8亿美元产值。

AMI [American Megatrends Inc]公司的发展小趣事

1890年,Emerson在美国密苏里州圣路易斯市成立,最初是一家电机和风扇制造商。1892年,新公司靠交流电机起家,并生产出了第一批销往北美的电风扇,净销售额接近6万美元。随着技术的不断革新,Emerson于1897年开始生产吊扇,这一创新使得高层建筑更加宜居,吊扇业务迅速成为公司的重要收入来源。

问答坊 | AI 解惑

TI 系列DSP功能比较与运用

DSP的内部指令周期较高,外部晶振的主频不够,因此DSP大多数片内均有PLL。但每个系列不尽相同。 1)TMS320C2000系列: TMS320C20x:PLL可以÷2,×1,×2和×4,因此外部时钟可以为5MHz-40MHz。 TMS320F240:PLL可以÷2,×1,×1.5,×2,×2.5,×3, ...…

查看全部问答>

MOS管作为电源开关如何使用?

MOS管作为电源开关,控制给集成电路供电。漏极接电源,源极接到负载的VDD,通过栅极来控制。这样应用可以吗? 好像一般的应用是电源先接到负载的VDD,负载(我这儿的负载是集成电路)的低再接到MOS管的漏极,MOS管的源极接地。当然还是通过栅极加电 ...…

查看全部问答>

有关wince下的用CreateFile获取串口句柄

1.通过查看WINCE的句柄,得到com1与com2的信息如下: [HKEY_LOCALMACHINE/drivers/BuildIn/Serial] (Default): (value not set) Dll: com165550.Dll Tsp: Unimodem.dll IoBase: 2926575616 Irq: 19 IoLen: 36 DeviceArrayIndex: 0 ...…

查看全部问答>

nand flash分区问题

我在看关于nand flash的代码,其中一部分如下: static struct mtd_partition partition_info[] = {         {                 name:            &n ...…

查看全部问答>

请问在PB6中如何生成usbser.dll库?

我用PB6+VS2005做CE系统. 发现有一个问题. 在common.bib中 ; @CESYSGEN IF CE_MODULES_USBSER    usbser.dll     $(_FLATRELEASEDIR)\\usbser.dll              &nb ...…

查看全部问答>

模拟器中没有加入mfc后遇到的问题。

LINK : fatal error LNK1104: cannot open file \'mfcs42d.lib\' 我的这个lib是在C:\\WINCE500\\OTHERS\\MFC\\LIB\\X86的路径下,我把此路经包含进tools-options后,仍然有错, 请问这是为什么? 如果我在PB下生成的emulator中没有加入mfc,是 ...…

查看全部问答>

有没有windows XP Embedded ?

有没有windows XP Embedded ? 有没有相关的学习资料和开发板卖?价格大概多少? 强烈要求把wince作为一个主论坛!…

查看全部问答>

香板,帮忙确认一下STM8L-Discovery无法连接调试

新购买的10pcs STM8L Discovery无法使用在板的STLink连接调试。 操作系统试过Windows 7 专业版、Windows XP,一共5台计算机都无法调试,但有台计算机使用Windows 7家庭版可以连上调试。 在出问题的计算机上软件使用过STVD 4.2、STVP3.22都无 ...…

查看全部问答>

LM3S811精简版开发板游戏程序需求

分析看了下这块板子,只有D2,L3~L8共7个指示灯程序可控,便想着使用这7个指示灯做个游戏程序。 这样的开发板不增加外设的情况下最适合玩打地鼠吧,L3~L8对应电脑按键QAZWSX吧,通过虚拟的232串口与开发板连接。 初步目标是每2秒随机出一只地鼠, ...…

查看全部问答>

电子工程师应该掌握的20个模拟电路,非常经典,值得下载!!

电子工程师应该掌握的20个模拟电路 非常经典,值得下载!!…

查看全部问答>