历史上的今天
返回首页

历史上的今天

今天是:2024年09月12日(星期四)

正在发生

2019年09月12日 | 谷歌全新推出低功耗的离线语音识别模型

2019-09-12 来源:eefocus

语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的缺点,那就是会有相应的延迟,用户必须等待Siri或其他虚拟助手来响应查询,而且如果语速过快就有极大可能造成误解。有延迟出现是因为用户的语音以及从中获取的数据必须从要手机传输到服务器,在那里进行分析后再发回。这可能需要从几毫秒到几秒的时间,如果数据包在过程中不小心失,则需要更长时间。


为什么不能直接在设备上进行语音识别呢?因为将语音转换成毫秒级的文本需要相当大的计算能力,这不仅仅是听一段声音和写一个单词,而是逐字逐句地理解一个人在说什么以及涉及到意图和整个语境。当然,手机其实是可以做到这一点的,但这并不会比把手机上的内容发送到云端快多少,而且会大量耗电。但随着该领域的稳步发展,这一目标似乎已成为可能,谷歌就使得这一功能在Pixel上得到实现。

谷歌推出全新低功耗的离线语音识别模型

为实现这一转变,Google团队花了五年时间研究问题并简化用于语音识别的AI系统。例如,旧版Gboard的听写软件由三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成文字输出,更新后的版本将所有这些工作集合到一个步骤中。


新模型还缩小了系统中被称为“解码器图形”的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配。在Gboard的听写模型的旧版本中,这个解码器图形大小为2GB,对于设备上处理来说太大了。相比之下,新版本仅为80兆字节,缩小了25倍。

你只需要说出你的查询,它会立刻被转录下来,并直接显示。它听到了你的声音后会立刻响应,而不用等到你完成整个句子再去揣测你的意思。但目前它只在谷歌键盘应用程序Gboard中工作,只在Pixel上工作,而且它只适用于美式英语。


“考虑到行业趋势,随着专业硬件和算法改进的融合,我们希望这里介绍的技术可以很快用于更多语言和更广泛的应用领域,”谷歌写道。


推荐阅读

史海拾趣

诚润电子(CHEVRON)公司的发展小趣事

在电子行业中,产品质量是企业生存和发展的关键。诚润电子深知这一点,因此在生产过程中严格把控每一个环节,确保产品质量的稳定性和可靠性。这种对品质的执着追求,使得诚润电子的产品在市场上赢得了广泛的认可和信任。许多知名品牌都选择了诚润电子作为他们的合作伙伴,共同为消费者提供优质的电子产品。

Diconex公司的发展小趣事

人才是企业发展的核心动力。Diconex公司高度重视人才培养和引进工作。公司建立了完善的人才培养机制,为员工提供广阔的发展空间和良好的职业晋升通道。同时,公司还积极引进行业优秀人才,为公司的快速发展提供了有力的人才保障。这种人才战略的成功实施使得Diconex在电子行业中拥有了强大的技术团队和人才队伍。

HELUKABEL公司的发展小趣事

在电子行业的激烈竞争中,Diconex公司凭借其卓越的技术创新能力脱颖而出。公司成立之初,便专注于研发高性能、低能耗的半导体芯片。通过不断的研发投入和团队努力,Diconex成功推出了一系列具有行业领先水平的产品,赢得了客户的广泛认可。随着技术的不断升级和市场需求的不断增长,Diconex逐渐在电子行业占据了一席之地。

Blue Creation公司的发展小趣事

在市场竞争日益激烈的背景下,Blue Creation公司意识到单打独斗难以立足。于是,公司积极寻求与其他企业建立合作关系。通过与一家知名芯片制造商的深度合作,Blue Creation成功将其电源管理技术集成到对方的芯片产品中,双方共同开拓市场,实现了互利共赢。这一举措不仅提升了Blue Creation的知名度,也为其带来了稳定的收入来源。

Advanced Analog公司的发展小趣事

创新是Advanced Analog公司发展的核心动力。公司始终坚持自主研发和技术创新,不断推出新的产品和技术。这些新产品不仅满足了市场的多样化需求,也进一步巩固了公司在电源管理IC领域的领先地位。同时,Advanced Analog还积极关注行业发展趋势和未来技术走向,为公司的长远发展做好战略布局。

Esico-Triton公司的发展小趣事

Esico-Triton公司成立于XXXX年,起初是一个小型的电子设备研发团队。当时,创始人[XXXXX]和[XXXXX]看到了电子设备市场的巨大潜力,于是决定合作创办一家公司。他们的初衷是开发一款能够简化工作流程的电子设备。在公司创立初期,资金紧张,研发条件有限,但团队成员凭借着对技术的热情和专业知识,成功研发出了第一款产品——一款便携式数据处理器。这款产品因其便携性和高效性受到了市场的欢迎,为Esico-Triton的后续发展奠定了坚实的基础。

问答坊 | AI 解惑

ATMEGA8535.pdf

ATMEGA8535.pdf中文资料…

查看全部问答>

一个小问题困惑了我,求高手指点下

您好 我是想从手机的耳机孔取信号,来推动一个单稳态电路   从左往右把门电路分别称为门1、门2、门3、门4. 门3、门4.组成的单稳态电路,很成功 ,用手指碰门2的输入端可使单稳态翻转。   门1组成的放大器,把手机的耳机信号放大后送 ...…

查看全部问答>

c51单片机与D801L指纹模块串口通信

我想让我的单片机发送一串命令去控制指纹模块D801L,在PC上用串口调试助手往模块发指令模块都有反应,把单片机的串口接到PC上可以看到单片机正确的发送了一串命令到PC上,可是将其接口接到指纹模块上却没有任何反应,(指纹模块是ttl电平,我将单片 ...…

查看全部问答>

超大容量的Nand Flash驱动

正准备折腾一个三星4GB/8GB/64GB的Nand Flash到基于S3C2440的WinCE系统上,希望大家多多支持! 请大家多多建言!…

查看全部问答>

求教一个ftp的连接问题

用PC机可以很轻松的连上公司内部的ftp,写了一个在WINCE下的ftp代码,也可以连接ftp,并且下载,但是如果我在下载过程中非正常中断与ftp的连接以后,我重新运行程序就无法连接上ftp,在用户验证那块一直无法得到服务器的回应信息,一定要等很久才可 ...…

查看全部问答>

ring3如何调用键盘过滤驱动

如题,这个键盘过滤驱动里生成了很多设备,这些设备到绑定到了Kdbclass上的设备上,在ring3如何使用这个驱动…

查看全部问答>

wince平台搭建

我是wince初学者,在网上看到不同的wince平台搭建方式,不知道应该选那种,是不是不同开发类型环境不同?“??比如驱动开发是一种环境 其他的就不是了。 请高手指教 假如是做驱动开发,都要什么软件以及平台搭建方法,(现在是单个pc环境)。如 ...…

查看全部问答>

用JTAG連接MSP430出現error

各位大大好,小弟是MSP430的初學者, 我用的是MSP430F1232這塊晶片,JTAG控制器型號是MSPFET-UIF,操作軟件用的是IAR,當小弟complier完將程式programmig進去晶片,出現下面的錯誤(附件),請教各位大大,這是怎樣的問題?應該如何解決?     < ...…

查看全部问答>

在装载程序时,出现擦除或者写入flash失败

在装载程序时,出现擦除或者写入flash失败。 我直接用TI的例程也是这样。用的28035,型号肯定是对的。…

查看全部问答>