目录
第一章 系统的主要功能与分模块描述 2
1.1 系统的主要功能 2
1.2 分模块描述 3
第二章 主要芯片 3
2.1 主处理器芯片 3
2.2 辅助芯片 4
2.2.1:LD3320语音芯片 4
2.2.2 cc3200无线wifi处理器 4
第三章 系统芯片的引脚连接示意图 5
第四章 系统关键技术及软件设计 6
4.1 系统关键技术 6
4.1.1 语音识别技术 6
4.2.2 端点检测VAD(Voice Activity Detection) 7
4.1.3 非特定语音识别 7
4.2 软件设计 8
第五章 系统效果展示 10
随着人类社会的进步与科技的迅猛发展,人们开始追求更加智能舒适的家居环境,由此智能家居得到迅速发展。作为智能家居的重要组成部分,智能家居控制系统也备受考验,例如控制形式单一、用户体验质量低、个性化与自由度不足等情况。为此我们设计了一套全语音控制的未来之家系统。
本作品在设计过程中对以下几大难点进行了重点突破
1:通过预同步与垃圾关键词的方式显著提高了语音识别率
2:语义的理解与合成
3:滤波的算法设计
与此同时,这些难点的存在也促进了以下几大创新点
1:全语音控制。
2:非特定语音识别。本作品在识别关键词语时,采用了音标标注出要识别的关键词语的方式。因此,它具备了识别简单的外文和纯方言的能力。更加的智能化。
3:可动态编辑自定义口令。客户可以随心所欲进行自定义识别口令的编辑。更加的人性化。
4:可扩展性强。本作品使用CC3200无线微控制器为接下来如无线控制、连接云平台等更多的功能扩展作铺垫。
主处理器采用STM32F103ZET6
LD3320 芯片是一款“语音识别” 专用芯片,由 ICRoute 公司设计生产。该芯片集成了语音识别处理器和一些外部电路,包括 AD、 DA 转换器、麦克风接口、声音输出接口等。本芯片在设计上注重节能与高效,不需要外接任何的辅助芯片如 Flash、 RAM 等,直接集成在现有的产品中即可以实现语音识别/声控/人机对话功能。并且,识别的关键词语列表是可以任意动态编辑的。
针对物联网 (IoT) 应用的SimpleLink CC3200 器件是一款集成了高性能 ARM Cortex-M4 MCU 的无线 MCU, 从而使得客户能够用单个集成电路 (IC) 开发整个应用。 借助片上 Wi-Fi, 互联网和稳健耐用的安全协议, 无需之前的 Wi-Fi 经验即可实现更开速的开发。
这里我们主要用于以后的无线控制扩展使用。
采用基于"关键词语列表"的识别技术:ASR(Auto speech recognition )技术。即把通过MIC输入的声音进行频谱分析->提取语音特征->和关键词语列表中的关键词语进行对比匹配->找出得分最高的关键词语作为识别结果输出。
VAD(Voice Activity Detection) 技术是在一段语音数据流中,判断出哪个时间点是人声的开始,哪个时间点是人声的结束。判断的依据是,在背景声音的基础上有了语音发音,则视为声音的开始。而后,检测到一段持续时间的背景音(比如600毫秒),则视为人声说话结束。
通过VAD判断出人声说话的区域后,语音识别芯片会把这期间的声音数据进行识别处理后,计算出识别结果。
语音识别,识别的是“语音”。对于非特定人语音识别来说,在描述关键词语时,是用音标标注出要识别的关键词语。
对于目前 LD3320 支持的中文识别来说,就是用拼音来描述出关键词语。也就是说,只要是拼音可以拼出的发音,都是可以输入芯片并进行识别的。
因此,在某些场合需要识别一些简单的外文或者纯方言发音的时候,可以用拼音标注的方法来实现。