PCA方法详解和人脸识别应用实例.docx

下载文档 降价啦

4
0
约9.58千字
约 21页
2018-06-11 发布于湖北
举报
版权申诉
保障服务

PCA方法详解和人脸识别应用实例.docx

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第一节主成分分析基本理论一、什么是主成分分析？主成分分析为Principle component analysis[10,11,12]的中文翻译，其英文简写为PCA。它是一种非常流行和实用的数据分析技术，最重要的应用是对原有数据进行简化。主成分分析可以有效的找出数据中最“主要”的元素和结构，去除噪声和冗余，将原有的复杂数据降维处理，揭示出隐藏在复杂数据背后的简单结构。它的优点是简单，而且无参数限制，可以方便的应用与各个场合。因此应用极其广泛，从神经科学到计算机图形学都有它的身影。PCA被称为应用线形代数最有价值的结果之一。本节下面的内容将开始讲解PCA的具体内容。具体安排为：首先将从一个简单的例子开始说明PCA应用的场合以及想法的由来，进行一个比较直观的解释；然后加入数学的严格推导，引入线形代数，进行问题的求解。随后将揭示PCA与SVD(Singular Value Decomposition)之间的联系以及如何将之应用于真实世界。最后将分析PCA理论模型的假设条件以及针对这些条件可能进行的改进。二、例子在实验科学中常常遇到的情况是，使用大量的变量代表可能变化的因素，例如光谱、电压、速度等等。在实际中，由于实验环境和观测手段的限制，实验数据往往变得极其的复杂，混乱，而且数据存在很大的冗余。如何对数据进行分析，取得隐藏在数据背后变量间的本质关系，是一个很困难的问题。在神经科学、气象学、海洋学等等学科实验中，假设的变量个数往往非常之多，但是真正的影响因素以及它们之间的关系可能又是非常之简单的。下面的例子取自一个我们都非常熟悉的物理学中的实验。这个实验看上去似乎过于简单，但足以说明问题。如图表 4.1所示，这是一个理想弹簧运动规律的测定实验。假设球是连接在一个无质量无摩擦的弹簧之上，从平衡位置沿x轴拉开一定的距离然后释放。图4.1理想弹簧运动规律模型对于一个具有先验知识的实验者来说，这个实验是非常容易的。球的运动只是在x轴向上发生，只需要记录下x轴上的运动序列并加以分析即可。但是，在实际中，对于第一次做这个实验的实验者来说（这也是实验科学中最常遇到的一种情况），是无法进行这样的假设的。那么，一般来说，必须记录下球的三维位置(x0,y0,z0)。这一点可以通过在不同角度放置三个摄像机实现（如图4.1所示），假设以200Hz的频率拍摄画面就可以得到球在空间中的运动序列。但是，由于实验的限制，这三台摄像机的角度可能比较任意，并不是正交的。事实上，在真实世界中也并没有所谓的x,y,z轴，每个摄像机记录下的都是一幅二维的图像，有其自己的空间坐标系，球的空间位置是由一组二维坐标记录的：[(xA,yA)(xB,yB)(xC,yC)]。经过实验，系统的摄像机记录了几分钟球的位置序列。怎样从这些数据中得到球是沿着某个x轴运动的规律呢？怎样将实验数据中的冗余变量剔除，化归到这个潜在的x轴上呢？在真实的实验场景中，数据的噪音是必须面对的因素。在这个实验中噪音可能来自空气、摩擦、摄像机的误差以及非理想化的弹簧等等。噪音使数据变得混乱，掩盖了变量间的真实关系。如何去除噪音是实验者每天都要思考和解决的问题。上面提出的两个问题就是PCA方法要解决的目标。PCA主成分分析方法是解决此类问题的一个非常有效的工具。下文将结合以上的例子提出解决方法，逐步叙述PCA方法的思想和求解过程。三、基变换从线形代数的角度来看，PCA的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原有的数据间的关系。在这个例子中，沿着某x轴上的运动是最重要的。这个维度即最重要的“主元”。PCA 的目标就是找到这样的“主元”，最大程度的去除冗余和噪音的干扰。标准正交基为了更有利于推导，将对上述例子的数据作出定义为：在实验过程中，在每一个采样时间点上，每个摄像机记录一组二维坐标为(x,y)，综合三台摄像机数据，在每一个时间点上得到的位置数据对应于一个六维列向量。（4.1）如果以200Hz的频率拍摄10分钟，将得到10*60*200=120000个这样的向量数据。抽象一点来说，每一个采样点数据都是在m维向量空间（此例m=6）内的一个向量，这里的m是涉及到的变量个数。由线形代数知识可以知道，在m维向量空间中的每一个向量都是一组正交基的线形组合。最普通的一组正交基是标准正交基，实验采样的结果通常可以看作是在标准正交基下表示的。举例来说，上例中每个摄像机记录的数据坐标为(x,y)，这样的基便是[(1,0),(0,1)]。那为什么不取或是其他任意的基呢？原因是，这样的标准正交基反映了数据的采集方式。假设采集数据点是(2,2)，一般并不会记录。(在基下），因为一般的观测者都是习惯于取摄像机的屏幕坐标，即向上和向右的方向作为观测的基准