人脸识别是身份识别的一种方式,目的就是要判断图片和视频中人脸的身份时什么。
本文将详细介绍人脸识别的4个特点、4个步骤、5个难点及算法的发展轨迹。
什么是人脸识别?
人脸识别是 计算机视觉-computer Vision 领域里很典型的应用。
人脸识别的目的就是要判断图片和视频(视频是由图片构成的)中人脸的身份是什么。
人脸识别是身份识别的一种,它跟身份证识别、指纹识别、虹膜识别都是相似的。可以将人脸识别和大家熟悉的身份证做对比:
- 录入信息(开通身份证 – 录入人脸信息)
- 将信息存入数据库(身份证信息 – 人脸信息)
- 当需要验证身份时,将新采集信息和数据库信息作比对(扫身份证 – 刷脸)
人脸识别有4个特点
人脸识别和其他身份识别相比,有4个特点:
- 便捷性。人脸是生物特征,不需要携带类似身份证的东西
- 非强制性。识别的过程甚至不需要对象的配合,只要拍摄到人脸就可以进行识别,例如安防领域就是如此。
- 非接触性。不需要跟设备进行接触,相比指纹更加安全一些。
- 并行处理。一张照片里有多个人脸时可以一起处理,不像指纹和虹膜,需要一个一个来。
基于以上特点,人脸识别正在被广泛的应用在各个领域。大家在生活中随处都可以看到人脸识别的应用。
人脸识别的 4 个步骤
人脸识别的过程中有4个关键的步骤:
- 人脸检测
- 人脸对齐
- 人脸编码
- 人脸匹配
下面详细说明一下这4个步骤。
人脸检测
人脸检测的目的是寻找图片中人脸的位置。当发现有人脸出现在图片中时,不管这个脸是谁,都会标记出人脸的坐标信息,或者将人脸切割出来。
可以使用方向梯度直方图(HOG)来检测人脸位置。先将图片灰度化,接着计算图像中像素的梯度。通过将图像转变成HOG形式,就可以获得人脸位置。
人脸对齐
人脸对齐是将不同角度的人脸图像对齐成同一种标准的形状。
先定位人脸上的特征点,然后通过几何变换(仿射、旋转、缩放),使各个特征点对齐(将眼睛、嘴等部位移到相同位置)。
人脸编码
人脸图像的像素值会被转换成紧凑且可判别的特征向量,这也被称为模板(template)。理想情况下,同一个主体的所有人脸都应该映射到相似的特征向量。
人脸匹配
在人脸匹配构建模块中,两个模板会进行比较,从而得到一个相似度分数,该分数给出了两者属于同一个主体的可能性。
人脸识别的 5 个难点
人脸图像在现实世界中的呈现具有高度的可变性。所以人脸识别也是最有挑战性的生物识别方法之一。人脸图像可变的地方包括:
- 头部姿势
- 年龄
- 遮挡
- 光照条件
- 人脸表情
人脸识别算法的发展轨迹
人脸识别领域,也是从传统机器学习算法过度到深度学习算法的。
传统机器学习算法
在机器学习阶段,人脸识别也经历了3个重要的阶段:
- 几何特征阶段
- 表象特征阶段
- 纹理特征阶段
深度学习算法
在深度学习阶段,算法的发展也同样经历了3个阶段:
- 从最开始的 VGG 网络到 Inception 网络再到 Resnet 网络,网络模型总体上呈现出更深,更宽的趋势。
- 旷视、商汤为代表的在学术公开竞赛中取得好成绩的这些厂商,开始发展实际业务为起点,通过不断扩大他们的实际数据集合,算法性能也在逐渐的提升。
- 进一步增加数据量以提升算法性能以外,与第一阶段相反,大家开始在不降低识别性能的基础上,研究网络的轻量化。轻量化的主要目的有两个,一个是提升算法的速度,甚至能够部署到移动端;另外一个就是便于硬件实现,从而将人脸识别算法直接做成一个硬件模块。
想要详细了解不同阶段的技术细节,可以看这篇文章《一文看懂人脸识别技术发展脉络》
人脸识别的典型应用
人脸识别的应用变得越来越广泛,只要跟身份识别相关的未来都有可能使用人脸识别。下面列几个典型的应用场景。
- 门禁系统
- 安防系统
- 无人超市
- 电子护照及身份证
- 自主服务系统(如ATM)
- 信息安全系统,如刷脸支付
- 娱乐型应用,如抖音里的部分道具
百度百科+维基百科
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
面部识别系统是能够在技术识别或验证从一个人的数字图像或视频帧从视频源。面部识别系统有多种方法可以工作,但一般来说,它们通过将给定图像中的选定面部特征与数据库中的面部进行比较来工作。它还被描述为基于生物识别人工智能的应用程序,其可以通过基于人的面部纹理和形状分析模式来唯一地识别人。
虽然最初是计算机应用的一种形式,但近来在移动平台和其他形式的技术(例如机器人技术)中已经有了更广泛的用途。它通常用作安全系统中的访问控制,并且可以与其他生物识别技术(如指纹或眼睛虹膜识别系统)进行比较。虽然面部识别系统作为生物识别技术的准确性低于虹膜识别和指纹识别,但由于其非接触式和非侵入性的过程,它被广泛采用。最近,它作为商业识别和营销工具也变得流行。其他应用包括高级人机交互,视频监控,图像自动索引和视频数据库等。
Comments