历史上的今天
返回首页

历史上的今天

今天是:2025年05月29日(星期四)

正在发生

2018年05月29日 | 电话机器人核心技术之ASR

2018-05-29 来源:互联网

什么是ASR

技术,也被称为自动语音识别Automac Speech RecogniTIon(ASR),其目标是将人类的语音中的词汇内容转换为可读的输入,例如按键、二进制编码或者序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

国内发展

我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学工程系与中科院自动化研究所模式识别国家重点实验室。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

语音识别系统的三大部分

语音信号预处理与特征提取:语音识别一个根本的问题是合理的选用特征。特征参数提取的目的是对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息,同时对语音信号进行压缩。

声学模型与模式匹配:声学模型通常是将获取的语音特征使用训练算法进行训练后产生。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。

语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。

推荐阅读

史海拾趣

DPA Components International公司的发展小趣事

在成功立足国内市场后,DPA Components International公司开始积极拓展国际市场。公司深入了解不同国家和地区的市场需求,针对性地调整产品策略和服务模式。通过参加国际展会、建立海外销售网络以及与国外企业合作,DPA逐渐打开了国际市场的大门。在国际市场上,DPA凭借其卓越的产品质量和专业的技术服务,赢得了众多客户的信任和支持,进一步提升了公司的品牌影响力和市场份额。

DIALIGHT公司的发展小趣事

DIALIGHT公司一直专注于工业LED照明领域的发展。他们深入了解工业空间照明的需求和挑战,设计了一系列专为工业应用而定制的LED照明产品。这些产品不仅易于安装和维护,而且能在恶劣的环境下持续使用。此外,DIALIGHT还提供集成系统解决方案,帮助客户降低能源成本、维护成本和碳足迹,同时提高设施的安全性和生产力。通过不断创新和优质服务,DIALIGHT在工业LED照明领域赢得了广泛的认可和信赖。

Hammond公司的发展小趣事

DIALIGHT公司的故事始于1938年的纽约布鲁克林,当时该公司专注于为飞机生产仪表板灯。随着技术的不断进步和市场的变化,公司在1971年,即LED推出仅一年后,推出了他们的第一个LED产品。这一举措标志着DIALIGHT正式从传统的飞机仪表板灯制造转向LED照明技术的研发和应用。从此,DIALIGHT彻底改变了LED的用途,将其广泛应用于世界各地的交通控制、指示灯、结构塔和工业场所,为全球提供了优质的照明解决方案。

Frequency Management International公司的发展小趣事

Frequency Management International公司成立于1971年,自创立之初,FMI便专注于为通信市场提供快速交货和严格公差的石英晶体和晶体振荡器。在成立初期,公司凭借其高质量的产品和可靠的服务,逐渐在通信市场中站稳了脚跟。随着技术的不断进步和市场需求的日益增长,FMI不断扩大生产规模,提升产品质量,为公司的后续发展奠定了坚实的基础。

Hitachi Metals公司的发展小趣事

自1956年成立以来,Hitachi Metals便逐步在电子材料领域建立了坚实的基础。公司早期便专注于研发和生产用于电子设备的核心部件,如磁性材料。随着电子行业的蓬勃发展,日立金属迅速抓住了市场机遇,推出了高性能的Nd-Fe-B系列烧结磁石和高性能铁氧体烧结磁石,这些材料广泛应用于计算机、半导体集成电路器件及平板显示屏等高科技产品中。凭借其卓越的产品质量和稳定的市场供应,Hitachi Metals在电子材料市场上赢得了广泛的认可。

驰兴电感(Coilank)公司的发展小趣事

为了进一步提升产品的竞争力,驰兴电感积极开展国际合作。公司与国际知名电子元器件厂商建立了长期稳定的合作关系,共同研发新产品、新技术。这些国际合作不仅使驰兴电感能够借鉴国际先进经验和技术,还为公司带来了更多的市场机会和资源。

问答坊 | AI 解惑

滤波器的输出让人匪夷所思

max4243设计单电源带通滤波器,二阶单位增益巴特沃思, F1=1Hz,F2=20Khz ---------------------------------- Vcc=3.36v 在0输入的时候,直流偏置都为1.68 V 在15KHz,V有效值=280mv,滤波器的输出为278mv 但是,在频率不变,有效值增加的时候 ...…

查看全部问答>

CC2510的simpliciTI协议如何纠正错误

我配置完了就找那个配置文件都显示找不到路径 我然后编译就出现这个错误!!!希望牛人帮忙解决问题!! …

查看全部问答>

USB速度相关问题

1. U盘的读写速度有哪些决定因素?是不是包括1)接口:2.0 high speed vs. 2.0 full speed 2)Flash芯片读写速度。 2. USB延长线/转接线是不是有USB 2.0 high speed和USB 2.0 full speed之分?是不是会导致U盘连上后实际读写速度下降? 3. 我想比较U ...…

查看全部问答>

现在是做JAVA开发的(计算机专业出身的),想转硬件开发,大家给我指一条学习路线吧,谢谢各位了。

现在是做JAVA开发的(计算机专业出身的),想转硬件开发,大家给我指一条学习路线吧,谢谢各位了。…

查看全部问答>

请教vxworks下 定时器的ticks设置无效问题。

请问: /* system clock initial */     sysClkOringnalRate = sysClkRateGet();     printf(\"\\n system clock original rate = %d\", sysClkOringnalRate);     if (sysClkConnect ((FUNCPTR)clock_main,NO_A ...…

查看全部问答>

求助,IAR和KEIL怎么使用代码折叠功能(已解决KEIL的设置了)

求助,IAR和KEIL怎么使用代码折叠功能,不知道怎么设置了,谢谢了 [ 本帖最后由 dyc1229 于 2010-12-9 09:54 编辑 ]…

查看全部问答>

TInergy系列文章(四):LCD 助推 LED 发展

TInergy是一个能源社区,社区中的人们相信技术创新使生活的方方面面更具效率,技术创新更是通向清洁、低价和可再生能源的桥梁。 作为社区的一分子,德州仪器的能源专家将分享能源开发利用的新见解,使能源利用率更上一层楼,在降低能耗的同时,让 ...…

查看全部问答>

STM32定时器同步

三个定时器 TIM1 TIM2和TIM3,  用TIM2做主模式其他两个做从,可以实现。但是以TIM3做主模式,TIM1和TIM2做从时,定时器无法启动。是不是在这种情况下TIM3不能做主模式啊?下面是程序代码,请大家帮帮忙 。 ARE AND/OR THE USE MADE BY ...…

查看全部问答>

富士通FRAM心得提交

11月就收到样品了,提交申请,湖北武汉力源那边代理就发过来样品,我申请的是一款EEPROM,64K ,电压是2.7~3.6V, 10PCS.sop8 的封装。有图片送货单,还有静电包装。由于前期设计,还有客户的要求多,所以项目等了好久才开始,客户小姐还打电话过来跟 ...…

查看全部问答>

关于ARM9的按键中断

最简单的按键中断控制led亮灭,调了将近两天还是出不来。求大神们拯救。 minni2440的板子 #include\"2440addr.h\" #define U32 unsigned int static void __irq Key_ISR(void); delay() { volatile int i; for(i=0;i…

查看全部问答>