历史上的今天
返回首页

历史上的今天

今天是:2025年05月03日(星期六)

2019年05月03日 | 鬼都藏不住,人脸识别新突破!就算遮住半张脸也能100%被识别

2019-05-03 来源:新智元

众所周知,人脸识别在摄像头无法捕捉到完整面部图像的情况下很难获得理想的效果。最近布拉德福德大学的研究人员在不完整面部识别方面获得了突破性进展,实验表明,扫描整个面部的3/4、甚至1/2的识别准确率能够达到100%!

基于计算机的人脸识别已经成为一种成熟且可靠的机制,实际上已被应用于许多访问控制场景,不过目前面部识别或认证,主要使用全正脸面部图像的“完美”数据来执行。但实际上,有许多情况下比如闭路电视摄像机往往只能拍到脸的一侧,或者如果被拍摄者戴了帽子、口罩等遮挡物,就无法获得完整的正脸。因此,使用不完整面部数据的面部识别是一个亟待开发的研究领域。

来自布拉德福德大学的研究团队的最新研究在不完整面部识别方面,取得了突破性进展,实验使用最先进的基于卷积神经网络的架构以及预先训练的VGG-Face模型,使用余弦相似度和线性支持向量机来测试识别率。团队在两个公开可用的数据集(受控的巴西FEI和不受控制的LFW)上进行了实验。

实验表明,扫描整个面部的3/4、甚至1/2的识别准确率能够达到100%!除此之外,团队还研究了面部的某个独立的部位,比如鼻子、脸颊、前额或嘴巴的识别率,以及图像的旋转和缩放对面部识别主体的影响。结果发现,如果只针对面部的某个独立的部位,比如鼻子、脸颊、前额或嘴巴,识别率总是相对较低。

据悉,这是第一个使用机器学习来测试面部不同部位识别率的研究,论文已发表在Future Generation Computer Systems上。下面新智元对本次实验进行介绍。

人类可以不受环境影响的识别人脸,那么计算机也可以吗?

面部是人类生命中视觉系统中绘制得最多的图片,所以大部分人类拥有卓越的面部识别能力。一般来说,我们不需要像面部识别AI那样必须正视别人的正脸才能识别出对方,通常对于我们只要一瞥即可分辨。

普遍认为大脑通过记住重要的细节,例如与眼睛,鼻子,前额,脸颊和嘴巴相对应的关键特征的形状和颜色,对面部进行区分。此外,人类大脑可以应对不同光线环境下、不同面部表情,以及远处面部的显著变化。

然而,与此相反,任何在光线、表情、姿势和即眼镜或胡子等等的变化,都可能对计算机的识别率产生巨大影响。不过,因为计算机处理海量数据的能力不断提高,可以认为机器算法(例如CNN)至少在面部匹配方面拥有优异的表现。

顺着这个逻辑,研究团队使用有遮挡的不完整人脸照片作为测试集,下面是一个测试集的示例图片,以及计算机对不完整人脸照片的识别过程。

示例图片

识别过程

使用CNN和VGG-Face,利用两个分类器进行不完整人脸的识别

团队主要研究面部的不同部分如何有利于识别,以及在机器学习场景中如何在对面部照片进行不同程度旋转、缩放的识别。实验使用基于CNN的架构以及预训练的VGG-Face模型来提取特征。然后使用两个分类器,即余弦相似度(CS)和线性SVM来测试识别率。下图表现了特征提取步骤的概述:

遮挡脸部的示例图片

基于VGGF的特征提取过程

VGG-Face模型

目前最流行和广泛应用于人脸识别的是VGGF模型,由Oxford Visual Geometry Group开发。该模型在一个超过2.6 K个体的2.6M面部图像的巨大数据集上进行训练。

在VGGF中,其中13层是卷积网络,其他是ReLU、pooling的混合体,最后一层是softmax。

13个卷积层

为了确定VGGF模型中用于面部特征提取的最佳层,通常必须进行一些试验和错误实验。在本实验中,团队发现最好的结果来自第34层。值得注意的是,该层是完全连接的层,位于神经网络的末端,这意味着提取的特征代表代表了全脸。

特征分类:为什么使用余弦相似度和线性SVM

本次实验中,研究团队使用了余弦相似度(CS)和线性SVM分类器。做出这样的选择基于两个原因:首先,团队测试了其他分类器后发现CS和线性SVM的效果最好;其次,通过实验和分析,团队发现这两个分类器能够更准确地分离数据。

余弦相似度

两个向量间的余弦值可以通过使用欧几里得点积公式求出:

给定两个属性向量, A 和B,其余弦相似性θ由点积和向量长度给出,如下所示:

这里的Ai和Bi分别代表向量A和B的各分量。

本次实验需要计算CS以通过使用Eqs找到测试图像和训练图像之间的最小距离。如图8所示:

线性SVM

SVM是一个二元分类算法,线性分类和非线性分类都支持。经过演进,现在也可以支持多元分类,同时经过扩展,也能应用于回归问题。在本实验中,研究团队对两种SVM都进行了测试,发现当使用部分面部作为测试集的时候,线性SVM能够获得更好的效果。

例如,对于右脸颊,线性SVM的识别准确率达到了24.44%,而具有径向基函数的非线性SVM的识别率仅为2.77%。

遮掉半张脸,准确率也能高达100%!

这项工作提供了一组全面的实验,使用面部的不同部分进行面部识别。

利用了两个流行的人脸数据集的人脸图像,即FEILFW数据集。使用级联物体检测器对两个数据库中的所有图像进行裁剪以尽可能地去除背景,以便提取面部和内部面部特征。但是,对于某些具有非常复杂背景的图像,如LFW数据库的情况,作者手动裁剪这些面部。

在这项工作中,已经进行了许多遮挡设置,以验证该方法可以处理正常和遮挡的面部识别任务。为此,进行了两组主要的实验:一组不使用局部,旋转和缩放的面部作为训练面部数据的一部分,另一部分使用部分,旋转和缩放的面部作为训练的一部分。

在每种情况下,使用两个分类器进行了14个涉及部分,旋转和缩小人脸的子实验。出于训练目的,使用了每个受试者70%的图像,这些图像也通过诸如填充和翻转之类的操作来增强。在每种情况下,剩余的30%的图像用于测试。

从FEI数据集中采样面部数据

用于测试FEI数据集上识别率的面部部分

在FEI数据库中使用基于面部部分的SVM和CS分类器的面部识别率 - 在训练中不使用/使用面部的面部部分

在FEI数据集上显示面旋转(10°到180°)

在FEI数据集上使用SVM和CS分类器的人脸识别率(基于训练集中没有和有旋转人脸图片)

一个在FEI数据集中缩小(10%到90%)人脸的例子

利用SVM和CS分类器对FEI中缩小后的人脸进行快速识别

一些来自LFW数据集的人脸图像样本

来自LFW数据库的面部部分样本

在LFW数据集上,分别使用SVM和CS两种分类器对训练中未使用/使用的人脸各部分进行识别

在LFW数据集上使用基于SVM和CS分类器的人脸旋转的人脸识别率(在没有和使用单个旋转面作为训练数据的情况下)

在LFW数据库上,基于SVM和CS分类器的图像缩放识别率

使用CS进行正确匹配的结果,对于嘴的部分

使用CS测量的错误匹配的结果,对于嘴的部分

正确匹配的结果使用CS测量,为右脸颊

应用前景

研究团队负责人Hassan Ugail教授表示这个结果展示了不完整面部识别的美好前景:“现在已经证明,可以从仅显示部分脸部的图像中,获得非常准确的面部识别率,并且已经确定哪些部分的识别准确率更高,这为该技术应用于安防或预防犯罪等方面,开辟了更大的可能性。”

不过Hassan Ugail教授还表示,目前实验还需要在更大的数据集上进行验证。显然,将来很可能用于面部识别的图像数据库也需要包含不完整面部的图像。

参考链接:

https://www.sciencedirect.com/science/article/pii/S0167739X18331133?via%3Dihub#b3


推荐阅读

史海拾趣

DINTEK公司的发展小趣事

由于篇幅限制,我无法直接给出5个完整的500字以上的DINTEK公司发展故事。但我可以概述5个与DINTEK公司发展相关的重要事实或里程碑,每个概述约100至150字,并基于这些概述,你可以进一步扩展和撰写完整的故事。

  1. 创始与国际化布局

DINTEK(鼎志电子股份有限公司)于1990年在台湾创立,凭借对电子行业的敏锐洞察,公司迅速崭露头角。为了拓展全球市场,DINTEK在欧洲和韩国设立了分公司,进一步巩固了其在全球电子行业的地位。这一国际化布局为DINTEK带来了更多的合作机会和市场份额。

  1. 进军中国大陆市场

1995年,DINTEK看到了中国大陆市场的巨大潜力,决定进入这一新兴市场。在北京成立了北京鼎志通业电子科技有限公司,作为在中国大陆的主要运营基地。随后,DINTEK陆续在东北、华北、华东等地设立办事处,实现了全国范围内的覆盖,为中国大陆的客户提供更加便捷的服务。

  1. 产品创新与认证

DINTEK一直注重产品创新和质量。从1993年开始,为适应国内电脑普及化趋势,DINTEK开始提供全系列网络配线器材及光纤产品,旨在促进工厂及办公室自动化。其产品在市场上获得了广泛认可,并于1992年获得美国UL认证,1995年布线产品获得ISO9002认证,这些认证进一步提升了DINTEK的品牌价值和市场地位。

  1. 技术合作与研发

DINTEK非常重视技术合作与研发。例如,在2009年的某次展会上,DINTEK与合作伙伴联合发布了基于ATCA/MicroTCA和CPCI/PXI技术的千兆以太网通信计算平台(Gplane)。这一产品的研发和推出,展示了DINTEK在通信计算领域的技术实力和市场洞察力。

  1. 社会责任与可持续发展

作为一家领先的电子公司,DINTEK始终注重履行社会责任和推动可持续发展。公司积极参与各种公益活动,并致力于通过技术创新和绿色生产来降低对环境的影响。同时,DINTEK也关注员工福利和职业发展,为员工提供广阔的发展空间和良好的工作环境。

基于以上概述,你可以进一步扩展每个故事,加入更多细节和背景信息,使其更加完整和生动。

Anadigm公司的发展小趣事

Anadigm是一家曾经存在的半导体公司,专注于可编程模拟信号处理器(PASP)技术。以下是Anadigm公司发展的相关故事:

  1. 公司成立与初期发展:Anadigm公司成立于1997年,总部位于美国加利福尼亚州圣塔莫尼卡市。公司的创始人致力于开发一种新型的可编程模拟信号处理器(PASP),以应对传统模拟电路设计的局限性。通过引入数字技术,Anadigm旨在提供更灵活、高性能的模拟信号处理解决方案。

  2. PASP技术的推出与市场应用:Anadigm公司于2000年推出了其首款可编程模拟信号处理器产品系列。这些器件具有灵活的可编程性和高度集成的特点,能够适应多种应用场景,包括电力管理、医疗设备、汽车电子和工业控制等领域。Anadigm的PASP技术受到了行业的关注,并在市场上取得了一定的成功。

  3. 技术创新与产品优化:Anadigm公司不断投入研发,致力于改进其PASP技术并推出更先进的产品。公司持续与客户合作,了解市场需求并进行技术创新,以满足不断变化的行业需求。Anadigm的产品不断优化,性能不断提升,赢得了客户的信赖和市场份额的扩大。

  4. 合并与收购:尽管Anadigm公司在PASP技术方面取得了一定的成就,但面临着激烈的市场竞争和资金压力。在公司运营一段时间后,Anadigm于2008年被美国半导体公司Exar Corporation收购。此次收购使得Anadigm成为Exar的全资子公司,继续在模拟信号处理领域发展。

  5. 最终终止业务:然而,随着时间的推移,Anadigm在市场上的地位逐渐下滑,未能在激烈的竞争中保持竞争优势。最终,Exar Corporation于2014年宣布终止Anadigm的业务,并关闭其产品线。这标志着Anadigm作为一个独立的实体在半导体行业的终结。

以上是Anadigm公司发展的一些主要故事,展示了该公司从创立到终止业务的发展历程。

Guerrilla RF公司的发展小趣事
电动机驱动电路故障还可能导致硬盘在运行时产生异常的噪音。
Atmel (Microchip)公司的发展小趣事

随着产品的不断完善和技术的不断进步,Atmel开始积极拓展全球市场。公司通过建立遍布全球的办事处和销售网络,将产品销往世界各地。同时,Atmel还注重品牌建设,通过优质的产品和服务,赢得了客户的信任和好评。这使得Atmel在全球微控制器市场中逐渐崭露头角。

CyOptics Inc公司的发展小趣事

在被Avago收购后,CyOptics并未停止其技术创新的步伐。公司继续投入研发,推出了一系列新的光学产品和解决方案,以满足不断增长的市场需求。例如,CyOptics的物理介质相关(PMD)IC产品系列,不仅提供了完整的GaAs芯片组件,还提供了跨阻放大器(TIA)、激光驱动器(LD)等一站式芯片套件解决方案,为客户提供了更加便捷和高效的服务。

申风(everanalog)公司的发展小趣事

随着技术实力的不断提升和产品线的日益丰富,申风(everanalog)公司开始积极拓展市场。公司凭借优质的产品和服务,逐渐在国内市场上树立了良好的品牌形象。同时,公司也积极开展国际合作,与国际知名企业建立了战略合作关系,共同推动集成电路产业的发展。这些合作不仅为公司带来了更多的商业机会,也提升了公司在国际市场上的竞争力。

问答坊 | AI 解惑

NI MeasurementStudio免费培训课程诚邀您参与

NI Measurement Studio是National Instruments(美国国家仪器有限公司)为Microsoft Visual Studio 2008/2005/.NET 2003和Visual Studio 6.0环境所开发出的一款集成式套件, 包括各种类别的测试、测量与自动化应用的控件。Measurement Studio针对 ...…

查看全部问答>

会汇编语言对学习基于ARM的嵌入式编程有帮助吗?

会汇编语言对学习基于ARM的嵌入式编程有帮助吗? 谢谢~~…

查看全部问答>

linux tftp启动的问题

rpm -q 存在tftp 和 tftp-server 进入vi /etc/xinetd.d/tftp 都配好了,disable =no 服务地址 /tftpboot 加了-s -c 也启动了xinetd,可就是启动不了tftp,测试的时候总是超时 在服务里tftp那项“开始”和“停止”都是灰的。也就是说没启动或者 ...…

查看全部问答>

WINCE 中怎样支持俄语界面

我在setting中选择了俄语但是显示还是英语,  在网上找了很多都没答案啊…

查看全部问答>

请问有需要CSR BlueLab蓝牙开发资料、SPI仿真器(SPI下载器)的吗?

你需要CSR 蓝牙开发的SPI仿真头(下载线)的吗? 具有UART-232转接口、复位键、HOLD键、 兼容1.8V  I/O口,串口收发可以倒换或短接,面积小巧、使用方便。 支持CSR的BlueLab、BlueSuite等工具。 联系 13261620407…

查看全部问答>

如何用c51实现占空比可调的方波

用c语言如何写单片机,使p1^0输出占空比可调的方波…

查看全部问答>

linux 2.6 USB的自动挂载问题

  嵌入式开发,要对USB设备进行管理。在linux 2.4 下插入USB设备可以从系统配置文件/proc/scsi/usb-storage*/* 中读出USB设备的插入状态,该文件最好一行Attached为yes就是已经插上USB设备了,若为no就是没有插上。现在linux 2.6下,并没 ...…

查看全部问答>

DCM 和CCM还是未分清

在开关电源设计中,电流控制模式中有的用DCM模式有的用CCM模式,想问一下,在设计一个电路前,怎么选择这两种模式呢?也就是说为什么有的电路选择DCM,而有的电路选择CCM; 看过一些档案材料;DCM与ccm确实有一些差异,CCM能储存更多的能量; 然后 ...…

查看全部问答>

STM32高端的和STR9系列似乎要抢饭碗啊

                                  …

查看全部问答>