历史上的今天
返回首页

历史上的今天

今天是:2025年04月22日(星期二)

正在发生

2019年04月22日 | 智能语音技术在安防行业的应用前景

2019-04-22 来源:安防知识网

从文字时代到图像时代,再到如今无处不在的语音时代,智能语音技术的流行和爆发不断刷新着人们的生活方式。亚马逊Echo的出现就是最鲜明的里程碑。

大环境表明,智能语音技术最广泛的应用还是智能单品(智能音箱、机器人)以及智能家居等领域,且语音识别技术是智能语音技术最为核心的落地技术。但需要提及的是,进入智能语音技术的发展**期,智能语音技术是时候该有一些比较新颖的落地场景出现了。

基于此背景,本文将对语音识别技术在安防行业的应用进行浅析。

语音识别的“择业”与“取景”,安防行业应是极佳入口

随着人工智能技术赋能各大行业,不少企业也已将战略转向了“AI+”。而基于安防行业广而大的应用前景,“AI+安防”很快就成为了市场的主流旋律。而身为人工智能技术的一大分支,智能语音技术自然也需要在安防行业进行“择业”与“取景”,首当其冲的就是语音识别技术。

学会与机器进行相互共同理解,即人机交互也一直是安防行业的智能核心所在。而语音识别技术作为人机交互最为核心的落地技术,该技术在安防行业也有不少落脚点,主要应用在以智能巡检机器人为代表的安防机器人身上。

与其他可发声的服务机器人类似,安防机器人通过内置的麦克风接受外界声音,并对人声进行识别和理解,一旦读懂“人声”背后有类似危险的行为存在,将自动触发报警系统进入防御状态,从而对目标人物起到安全防护的作用。

而除了安防机器人,在安防行业的智能酒店场景之中,语音识别技术也起到了关键性的作用。在阿里近日开张的未来酒店中,尽管人脸识别是其主打技术,但贯穿酒店服务全过程中的智能机器人也是不可缺乏的关键人物。在阿里未来酒店中,机器人充当着酒店前台的作用,对入住房客进行全过程引导,而在酒店房间中,房客也可通过与天猫精灵的交流,从而完善自己的住房体验。在未来酒店的入住过程中,不管是充当前台的机器人还是服务员天猫精灵,其都是通过语音识别技术完成人机交互,从而通过这种用语音识别技术打造的全栈式语音交互系统,随时随地打造智能互联的场景。

当然,语音识别技术在安防行业的应用,也涉足到了智慧金融、智慧教育等多个智慧化场景当中。

或者,智能语音技术可作为“人脸识别”的“好帮手”

以人脸识别技术为核心的视频监控时安防行业的主要应用,这种我们无需多谈,但未来我们是否也能脑洞大开,用智能语音技术辅助人脸识别,使得视频监控更为智能化。

市场都在谈语音识别技术,但很少有企业注意,声纹识别以及语音情感识别也归属于智能语音技术。

声纹识别也称说话人识别,通过将声信号转换成电信号,再用计算机进行识别。可具体分为说话人辨认和说话人确认。在不同场景,声纹识别技术的选择不同,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。

语音情感识别是情感识别的方式之一,是指由计算机自动识别输入语音的情感状态。计算机通过传感器对不同声调表情的语言信号,在时间构造、振幅构造、基频构造和共振峰构造等特征方面的构造特点和分布规律进行测算和分析,从而识别出所有语言声调中所隐含的情感内容。

尽管当前人脸识别技术的识别率高达99%甚至是99.9%,但剩下的1%甚至0.1%却是当前科技无法攻克的难题。想象一下,如果在当前具备人脸识别的视频监控系统中加入声纹识别和语音情感识别技术,形成的声像融合技术(读唇),即使目标受众处于无声状态,也能对其思想及行为进行预测和识别,当前的视频监控系统是否也将提升到一个新的智能化高度,真正做到“防患于未然”。

不可否认,由人脸识别、声纹识别以及语言情感识别形成的多模态交互系统,应该能安防行业打开不少新应用大门,例如场景分析和事件检测。而在新一轮AI产业变革下,多模态技术也将成为决胜关键。

但智能语音要“取景”安防行业,尚有难点需要解决

“无语音不安防”,听起来似乎是个挺好的愿景。但遗憾的是,就目前看来,智能语音要“取景”安防行业,还有许多难点需要解决。

广泛认为,人工智能在安防行业的应用布局,还有四个“如何”需要解决——如何打造场景化AI应用,满足用户需求?如何构建行业智能系统,解决产业实际问题?如何完善基础设施、产业标准和安全防范机制?如何构建互利共赢的智能产业新生态?而这四个如何,放在智能语音技术在安防行业的应用上来看,也毫无违和感。

远场语音识别应该是智能语音在安防行业进行语音识别中最为关键的核心技术,但这种技术依旧还存在着回声、噪声以及混响三大技术瓶颈、最为直观的例子在于,安防机器人在公共区域执行安保工作之时,由于所接收的语音信号太多,其无法对目标语音进行分离,从而无法进行正常识别。

再比如上文所提及的语言情感识别技术。实际上,将语音中的情感特征化比面部表情的特征化难得多,因为面部表情信号传达了个人特征和表情,并不传达语言信息,而语音信号是混合信息,包括说话者特征、情感和说话内容中强调的词汇和语法,其所需要进行训练和学习的数据都比人脸识别多得多。

而除了远场语音识别和语言情感识别技术难题,智能语音技术自身还有不少难题未能突破,包括、口音、目标说话人分离、多语种混杂、高效迁移与数据迭代以及行业标准和攻击防御等等,导致其不止在安防行业,现阶段AI智能语音在各行业的应用,似乎用“人工智障”来形容会更为合适。

小结:

业界广泛认为,AI不是刷榜炫技,是真正推动技术创新、解决产业问题。而在人工智能技术进入大规模应用的今天,更需要妥善 “择业”与“取景”之间的关系,从同质化中走出差异化出来。

人工智能时代如何打破技术瓶颈如何赋能各行各业,云知声董事长/CTO梁家蒽的四个解决或许是较为理性的思考:解决深度学习在产业规模化应用中的问题、解决非大数据、端到端、序列映射的问题、将数据与知识有效结合,形成高效迭代闭环以及从根本上提升机器的认知和学习能力。

2019年人工智能技术已逐渐回归理性,越来越多的难题开始显现出来。但对于产业来说,是最坏的时代也是最好的时代。


推荐阅读

史海拾趣

Automatic Connector公司的发展小趣事

为了保持技术创新的活力,Automatic Connector公司积极与高校和研究机构开展产学研合作。通过与这些机构的深度合作,公司能够及时了解最新的科研成果和技术趋势,为产品的研发和创新提供有力的支持。同时,公司还为合作机构提供实践平台和技术支持,实现了资源共享和互利共赢。这种产学研合作的模式为Automatic Connector公司的创新发展注入了强大的动力。

这五个故事虽然是以虚构的Automatic Connector公司为背景,但它们所反映的电子连接器制造企业的发展规律和市场环境是真实存在的。希望这些故事能够为您了解电子行业中的企业发展提供一些启示。

Alorium Technology公司的发展小趣事

在电子连接器行业,品质是决定企业生死存亡的关键。Automatic Connector公司深知这一点,因此在生产过程中严格执行品质管理标准。公司引进了先进的生产设备和质量检测仪器,确保每一件产品都符合高标准的质量要求。同时,公司还建立了完善的售后服务体系,及时解决客户在使用过程中遇到的问题。凭借卓越的品质和优质的服务,Automatic Connector赢得了客户的信赖和好评。

ETL [E-Tech Electronics LTD]公司的发展小趣事

E-Tech Electronics LTD(简称ETL)在创立之初就确立了其目标——为电子市场提供高质量、高性能的电子产品。公司凭借其创始人的远见卓识和团队的专业技术,成功开发了一系列电子产品,逐渐在市场上建立了良好的声誉。初期,ETL主要关注于特定领域的电子产品研发,通过不断优化产品设计,提升产品质量,逐渐赢得了客户的信任。

GE Oil & Gas Digital Solutions公司的发展小趣事
将振荡频率转换为数字信号并显示在LCD或LED屏幕上,可以直观地读取测量结果并减少人为读数误差。
APSA公司的发展小趣事

作为一家有社会责任感的企业,APSA公司始终注重可持续发展。公司在生产过程中积极采取环保措施,降低能耗和排放。同时,公司也积极参与社会公益活动,回馈社会。这些举措不仅提升了公司的社会形象,也为公司的长期发展奠定了坚实的基础。

请注意,这些故事是基于一般性的电子行业发展趋势和公司成长路径构建的,并不特指任何一家名为“APSA”的公司。如果你需要关于特定公司的信息,建议直接查阅该公司的官方网站或相关新闻报道。

诚润电子(CHEVRON)公司的发展小趣事

诚润电子深知,一个优秀的团队是企业成功的关键。因此,他们一直致力于打造一支高素质、专业化的团队。公司注重员工的培训和发展,为员工提供广阔的职业发展空间和良好的福利待遇。同时,诚润电子还积极营造一种积极向上的企业文化氛围,让员工在工作中感受到归属感和成就感。这种良好的团队建设机制为诚润电子的持续发展提供了有力的保障。

问答坊 | AI 解惑

wince上下载图片文件并保存

现在我知道网上有个图片的地址,我想用代码实现下载并保存下,有什么方法实现阿…

查看全部问答>

《AlientekSTM32例程手册》28个实验连载--串口实验--整理后

1.注意我们的教材讲解是基于寄存器操作,方便初学者理解透彻, 2.我们另外还提供了该实例的库函数源码,下载链接:https://bbs.eeworld.com.cn/icview-210815-1-1.html 3.此实验的教程在《Alientek STM32不完全手册》的 3.3节:   ...…

查看全部问答>

51最小系统(含原理图和PCB)

51最小系统(含原理图和PCB)…

查看全部问答>

NVIC_SetPriority(SysTick_IRQn, 0x04)

replyreload += \',\' + 1316591;NVIC_SetPriority(SysTick_IRQn, n);n=0x00~0x03  设置Systick为抢占优先级0n=0x04~0x07  设置Systick为抢占优先级1n=0x08~0x0B  设置Systick为抢占优先级2n=0x0C~0x0F   ...…

查看全部问答>

招业余工程师

我公司招业余工程师,不需要到公司,熟悉STM32F10X单片机,CAN通信编程。联系电话:13874216976…

查看全部问答>

g2553与nrf24l01接收端总能检测到载波

暑假期间要做一个5发一收的小玩意,因为以前调过51的24l01,决定移植到2553上,改用spi模块做,按教程一步一步调,发送端调完了,接收端出问题了,只有接收端,检测载波,不管哪个信道,全是有载波,把发送端上电,依旧没有接收,但是一直有载波没 ...…

查看全部问答>

基于ADE7758的功率表

亲爱的各位大神啊,玩过ADE7758的请给支个招呀…

查看全部问答>

[ESP32-Audio-Kit音频开发板测评]五、读一下ID

这个跑起来我觉得比上个还简单,直接找到读ID的例程 然后点向右键头的编译下载,并按住BOOT键,显示下载成功,按RESET键开始运行: …

查看全部问答>

PWM信号读取问题(换方式了麻烦删一下帖子吧)

本帖最后由 凉冰 于 2022-11-9 11:24 编辑 PWM信号读取问题(换方式了麻烦删一下帖子吧) …

查看全部问答>