[导读]
独立成分分析近年来广泛应用于人脸识别等模式领域。首先对人脸图像进行预处理降维,然后利用ICA算法获得人脸影像独立基成分,利用人脸影像独立基来构造一个子空间,最后利用待识别图像在这个空间上的投影进行人脸识别。针对训练样本个数,训练人数以及独立基数目影响识别率等三个问题进行实验,得出结果并进行分析。
引言
人脸识别是生物特征识别的重要组成部分。在商业、安全及司法等行业具有非常广泛的应用。人脸识别的方法主要通过计算机来实现一项智能的判别任务。总体而言,对图像的人脸识别可以是以下一些定义和描述:
(1)给定静止或视频图像,进行搜索,实现判断,找出人脸;
(2)确定一副照片中人脸的状态,如性别、表情、年龄等;
(3)给定未知人脸图像,与图库中已有人脸图形进行比较,鉴别归类。
这些任务适合于不同工作环境的要求,有些复杂系统可能包含上述的全部内容。人脸识别的处理方法主要有基于几何特征和代数特征的识别方法,前者将各个器官定位识别,简单易理解,但鲁棒性较差。
基于代数特征的识别方法,其核心思想是将人脸图像视作多维(即图像像素数目)的矢量集。对这些矢量进行统计识别或变换映射,达到分类识别的目的。这些多维变化映射判别的方法也就是常使用的子空间法。
本文利用独立成分分析(ICA)的方法对人脸的图像进行识别,构造的训练库具有多种表情和姿势。其识别具有较强的鲁棒性和正确率。对其中一些处理结果进行分析比较,具有广泛的应用价值。
1ICA处理方法基本原理
独立成分分析是盲信号分离中应用较成功的算法,其假设信号是若干独立源信号混合而成,采用适当投影,可以将其中的二阶和高阶统计信息提取出来,而且还能消除高阶相关性。其基本的做法是利用ICA算法对训练集图像进行求解得出一组独立的影响基,待测试的图像识别时,将其按照各个基的方向上进行投影。这样再利用距离等判别方法可以确定测试图所属的类别。
利用ICA算法对人脸进行识别,人脸的训练样本影像集X可以作为统计独立的基影像S和可逆混合矩阵A的线性组合:
X=AS
ICA算法的目的就是找出混合矩阵A或者分立矩阵W,使其满足下式:
其中,I为独立统计基影像S的估计。
从统计学观点上来讲,随即变量的非高斯性与统计独立密切相关,非高斯性最强的方向即ICA寻找的投影方向。因此,只要找出非高斯性最大情况下,对应的就是要找的独立成分方向[5-7]。
2算法概述及基本处理过程
2.1图像库选择和图像预处理
本文采用的图像库为OlivettiResearchLaboratory标准人脸数据库(如图1所示)。人脸库中共有40人的人脸照片,每人10幅,共400幅图片,图像格式为pgm,是移动式位图文件,处理起来较简便。每人的图片都是不同角度、不同时间且受一定光线和一些饰物(如眼镜等)影响。图像大小为112×92。很多
文献中可以对原始图像进行一定处理,在保持图像原有信息的情况下,尽可能减小图像尺寸。可以有效降低图像像素数目,也相当于后续处理前的一个降维。如采用小波处理等一些频谱脸处理方法或采用图像分割提取出脸部画面可提高信息有效性。
对人脸输入数据(首先是训练样本)灰度数据排列,即得到一个矩阵,其每一行是训练图的各行灰度值首尾相连表示,列数即是训练图的总数。具体的图像指代人脸编号,可以用以卷标函数进行定义。
对数据矩阵进行中心化处理,即去均值处理,然后进行白化处理,使得白化后的变量协方差矩阵为单位矩阵,利用协方差特征值分解。这些处理的主要目的是使得计算量能够减小。
2.2ICA独立成分基的生成
2.3人脸的识别
将待测试的人脸图像数据提取出,进行中心化和白化,然后再按上面所描述的方法生成的独立成分基上进行投影。每一个测试图都用余弦(cosine)判别方法来找出最近的类别。从而进行归类。余弦公式表述如下:
这就是一种相关系数的计算,相关系数越大说明两个特征向量的相似度就越高。这样,待测的向量(如mat2)就可以判断为mat1的人脸类别。将判断结果和真实值进行比较,可计算识别的正确率。
3实验结果及分析
按照上述方法,本文对人脸进行测试,对该算法下的实验效果,有几个问题值得关注,实验也是基于这些问题来进行测试的:
(1)训练样本和测试样本比例,对测试结果正确率的影响问题;
(2)训练样本和测试样本的总体数目,对于测试结果正确率的影响;
(3)独立成分个数对于测试结果的影响。
3.1训练样本数目对测试结果的影响
训练样本的数目对于测试结果显然影响较大,如果在可能的条件下,得到尽可能多的训练集,就可以使测试结果大大提高。训练样本每人取5、6、7、8、9等情况下所得到的识别正确率曲线。
3.2不同的数据集大小对识别率的影响
不同大小数据集,即训练和测试人数的大小对测试结果有一定的影响。图3描述了这一影响的实验结果。可以看出数据集大小和正确率大体是负相关(不是很严格),仅40人的训练和测试集识别率就有较大的降低。因此,对于较大规模且较重要的人脸识别过程必须考虑识别结果的可靠性。当然只有在训练数目以及下面要提到的独立成分分量数等方面选用较严格的参数。
3.3独立成分分量数目对识别率的影响
独立成分分量数目对识别率的影响是两个方面的。一方面独立成分分量数目越多,识别的精度就越高,但是从另一方面来讲,独立成分分量数目太多会影响计算的速度。在实验过程中虽然是少样本,速度可以承受,但是如果训练集很大,独立成分分量数比较多,则会影响到识别的速度。一般个人微机(2.6G双核)如处理1万像素图像400样本需耗时3小时以上才可以达到最大正确率。要求不高情况下,独立成分分量数目达到训练集的30%已经足以达到较佳效果。图4是不同独立成分分量数目下,测试的结果。每组训练样本为6个,测试样本为4个。从图4中可以看出,对于训练测试人数较少时,测试成功率较易达到很高的正确识别率(0.975%)。也可以说容易达到收敛。
4结束语
本文利用独立成分分析对人脸进行了识别实验。通过将人脸图像投影到子空间进行分类识别,达到判断人脸的目的。结果表明这种基于独立成分投影方法具有较高的准确率,并对于独立成分分析中一些比较重要的参数选择问题,进行了对比实验,以期在计算效率和准确率上达到一个均衡。实验结果表明,训练集的数目,总体样本人数以及采用的独立分量个数都对计算正确率有很大影响,呈现一种非线性的相关。这些结果也有助于设计人脸识别软件,或执行识别任务时参考。
声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们。
千家智客微信公众号
扫描下方二维码,关注千家智客微信公众号(qianjiacom),随时随地知晓智能行业天下事!