历史上的今天
今天是:2024年10月15日(星期二)
2021年10月15日 | 一个眼神就可轻松交互 探境科技智能家电控制方案
2021-10-15 来源:爱集微
近日,国内知名AI芯片公司探境科技发布了音旋风系列的第二代产品,共包括VOI311(轻量版)、VOI621(升级版)和VOI721(增强版)三款芯片。主要应用在联网生态、智能音箱和云端AI等领域方向。
随着信息技术的不断发展,人们生活水平的提高,智能家电设备进入到千家万户。语音识别技术日渐成熟,越来越多的智能家电设备都引入语音识别技术。现有技术通常利用通过语音的方式来对智能家电进行控制,如对智能家电进行语音唤醒等。
但是,在实际使用中,各种噪声、聊天等干扰都可能导致智能家电被误控制,导致控制准确率较低。为此,探境科技在2019年5月14日申请了一项名为“自然交互语音控制方法及装置”的发明专利(申请号:201910404081.4),申请人为北京探境科技有限公司。
根据该专利目前公开的相关资料,让我们一起来看看探境科技发明的基于人眼视线捕捉判定的家电控制方案吧。

如上图,为该专利中发明的自然交互语音控制方法的整体流程示意图,该步骤分为两步,首先由系统获取语音信号,如果该语音信号与预设语音控制指令一致,则获取图像信号。其次,如果该图像信号满足预设条件,则会通过预设语音控制指令对应的家电设备进行响应。
该方案中,主要利用这个原则:由于用户在通过语音方式有意识地唤醒家电设备时,其视线通常也是聚焦在家电设备上的;而若用户无意识地讲话触发了唤醒词时,其视线通常是不会聚焦在家电设备上的。
基于该原则,该专利中的方案在接收到语音信号后,会再捕捉图像信息,通过分析出图像中存在人眼视线朝向需要运行的家电设备时,就唤醒该家电设备,从而满足用户的使用需求。

在该过程中,其中很重要的一个功能就是识别用户的人眼视线特征,该专利中发明了如上图中的模型,该模型可以识别人眼视线朝向家电设备的样本感兴趣区域和人眼视线不朝向家电设备的样本感兴趣区域两种类型的图像。上图中为较为经典的深度神经网络结构,如在VGG、Inception以及ResNet中都有应用,可以较好地完成这两种类型的分类任务,由于分类模型的识别率较高,可以达到99%及以上,因此可以推测该专利中的方案具有较好的识别效果以及家电控制效果。
以上就是探境科技发明的基于人眼视线捕捉判定的家电控制方案,该方案利用图像信号来判断用户是否需要使用某种家电设备,避免了唤醒词或命令词误识别的可能性,并通过结合人眼视线确认的方法来决定哪个设备进行响应,使得设备唤醒方案更加便捷和人性化。
史海拾趣
|
STM32 中断与嵌套NVIC 快速入门。我也是靠看这本书才弄懂的:Cortex-M3 权威指南Joseph Yiu 著宋岩 译其实很简单。//CM3 有 最多240个中断(通常外部中断写作IRQs),就是 软件上说的 IRQ& ...… 查看全部问答> |
|
查2407的资料其频率为30M,对吗?我现在设的TxPER为0x1388,也就是5000,那么一个PWM周期为10000个CPU周期,即开关频率为3K,我算的对吗?还请知道的人指点指点!… 查看全部问答> |
|
zstack提供的例程,默认是启用了硬件握手功能,该功能让数据通讯更可靠。实际使用中,串行电缆、或者USB转232转换器不支持,硬件握手信号,导致通讯失败的情况不少。以SerialApp为例,说明如何禁用硬件握手功能。… 查看全部问答> |
|
有木有熟悉高校实验室设备采购、入门级示波器采购的?或者对国产示波器了解的筒子?给点暗示吧,如果你采购基础/入门级示波器(单价在5K以下),你会采购哪家的?(备选项:Rigol DS1000、泰克TBS1000、优利德UTS1000,安捷伦1000,或者其他牌子也 ...… 查看全部问答> |
|
7800系列三端稳压器(正输出) 输出电压固定的三端系列稳压器;输出电压有5V、6V、7V、8V、9V、10V、12V、15V、18V、20V、24V输出电流1A;5~18V输出的最大电压为35V、20V、24V输出的电大输入电压为40V;7800工作温度为-55~+150℃,7800C的为0~+ ...… 查看全部问答> |
|
首先登录网站http://www.ti.com.cn/lsds/ti_zh/analog/webench/overview.page 填写你需要的一些设计条件 1.进入TI主页,输入相关参数 2.点击“开始设计”便进入WEBENC DESIGNER的设计页面,选择了第一项:Module。 3.在优化后的方案中我选择 ...… 查看全部问答> |




