- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 基于PCA方法的人脸识别系统建模与实现
1 项目概述
人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。它广泛采用区域特征分析算法,融合了计算机图像处理技术与生物统计学原理于一体,利用图像处理技术从中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,具有广阔的发展前景(principal components analysis,PCA)
图3-1 人脸识别系统
人脸提取子系统(如图3-2所示)是利用肤色识别分割找出可能的肤色区域,然后进行感兴趣区域标定初步定位人脸,再以阈值控制得到人脸的主要部分,最后将提取的人脸经过统一处理后传给人脸识别部分和构建特征库。人脸识别子系统使用改进的PCA方法,在提高识别效率的基础上,求出一个特征脸空间后,将整张人脸投影到特征脸空间中,然后通过降维,秩的求取等运算构建出人脸重向量特征库,再以欧氏距离的结果对人脸进行判断、识别。
图3-2 人脸提取子系统
2.2 PCA理论
主成分分析(principal components analysis,PCA)又称主分量分析
2.2.1 弹簧振子模型
我们将从一个简单的例子来说明PCA应用的场合以及想法的由来,从而进行一个比较直观的解释,然后加入数学的严格推导,引入线形代数,进行问题的求解。随后将揭示PCA与SVD(Singular Value Decomposition)之间的联系以及如何将之应用于真实世界,分析PCA理论模型的假设条件以及针对这些条件可能进行的改进,最后将之应用于人脸识别中。
在实验科学中我们常遇到的情况是,使用大量的变量代表可能变化的因素,例如频率、电压、速度等等。但是由于实验环境和观测手段的限制,实验数据往往变得极其的复杂、混乱和冗余的。如何对数据进行分析,取得隐藏在数据背后的变量关系,是一个很困难的问题。在神经科学、电子信息学科中,假设的变量个数可能非常之多,但是真正的影响因素以及它们之间的关系可能又是非常之简单。实验科学的精髓就是从大量混杂的实验数据中统计挖掘出隐藏在背后的理论规律,再用建立起来的理论模型去指导生产实践从而大大提高生产效率。
下面的模型取自一个物理学中的实验。它看上去比较简单,但足以说明问题。如图3-3所示,这是一个理想弹簧运动规律的测定实验。假设一根无质量无摩擦的弹簧上连接一个球并水平放置于光滑平面上,从平衡位置沿轴拉开一定的距离然后释放。
图3-3 简谐运动模型
对一个具有先验知识的实验者来说,实验结果完全预知且实验也非常容易的执行。球的运动只会在轴向上发生,只需要记录下轴上的运动序列并加以分析即可。但是,在真实世界中,对于第一次实验的探索者来说(这也是实验科学中最常遇到的一种情况),是不可能进行这样的假设。那么,一般来说,必须记录球的三维位置。这一点可以通过在不同角度放置三个摄像机实现(如图1所示),假设以200Hz的频率拍摄画面,就可以得到球在空间中的运动序列。但是,由于实验的限制,这三台摄像机的角度可能比较任意,并不是正交的。事实上,在真实世界中也并没有所谓的轴,每个摄像机都记录下有自己空间坐标系的一幅二维图像,因此球的空间位置是由一组二维坐标记录。经过实验,系统产生了球的位置序列。怎样从这些数据中得到球是沿着某个轴运动的且符合简谐运动规律呢?怎样将实验数据中的冗余变量剔除,化归到这个潜在的轴上呢?
这是一个真实的实验场景,收集数据时引入的噪音是必须面对的因素。在这个实验中噪音可能来自空气、摩擦、摄像机的误差以及非理想化的弹簧等等。噪音使数据变得混乱,掩盖了变量间的真实关系。如何去除噪音是实验者每天所要面对的巨大考验。
上面提出的两个问题就是PCA方法的目标。PCA方法是解决此类问题的一个有力的武器。下文将结合以上的例子提出解决方案,逐步叙述PCA方法的思想和求解过程。
2.2.2 线形代数
从线形代数的角度来看,PCA的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原数据间的关系。在这个例子中,沿着轴上的运动是最重要的。这个维度即最重要的“主元”。PCA的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。
2.2.3标准正交基
为了引入推导,需要将上文的数据进行明确的定义。在上面描述的实验过程中,在每一个采样时间点上,每个摄像机记录了一组二维坐标,综合三台摄像机数据,在每一个时间点上得到的位置数据对应于一个六维列向量。
如果以的频率拍摄10分钟,将得到个这样的向量数据。请注意,每个摄像机的值的参考点是不同的,如与不表示他们在沿x轴上在同一位置。
抽象一点来说,每一个采样点数据都是在维向量空间(此例中)内的一个向量,这里的是牵涉的变量个数。由线形代数知识可知在维向量空间中的每一个向量都是一组正交基的线形组合。最普
文档评论(0)