维数约简经典法综述.ppt

下载文档 降价啦

8
0
约1.51千字
约 20页
2017-06-13 发布于河南
举报
版权申诉
保障服务

维数约简经典法综述.ppt

1、本文档共20页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

维数约简经典法综述

2011年12月5日;研究背景经典方法介绍 ;举例处理200个256*256的图片时，通常我们将图片拉成一个向量，这样，得到了65536*200的数据，直接处理数据？维数灾难巨大的计算量将使我们无法忍受数据本质过多的数据量，不能反映出数据的本质特征，如直接对这样的数据进行处理，很难得到理想结果 ;基本原理高维输入空间通过线性或非线性映射投影到一个低维空间，从而找出隐藏在高维观测数据中有意义的低维结构原始数据大量冗余根据变量相关性几何观点研究重点保留核心信息;方法：线性和非线性线性：PCA LDA 基于核函数：KPCA 基于特征值的非线性方法：MDS ISOMAP LLE ;思想：找出最能代表原始数据的投影方法如果理解？维数约简后的数据不能失真除掉噪声、冗余数据 ;PCA实现的关键降噪：使留下的维度间的相关性尽可能小去冗余：使留下来的维度含有的“能量” 尽可能大协方差矩阵对角化;形成样本矩阵，将样本中心化计算样本矩阵的协方差矩阵对协方差矩阵进行特征值分解，选取最大的p个特征值对应的特征向量组成投影矩阵对原始样本进行投影，得到维数约减后的新样本矩阵;注意：PCA属于非监督基本思想：投影。首先找出特征向量，把这些数据投影到一个低维的方向，使得投影后不同的类之间尽可能的分开，而同一类内的的样本比较靠近，然后在新空间中对样本进行分类。 ;躯瓮聚霞长绰眯杯名潦售喻栏皑做斟龙麓郎乘霍眷嫌诸鸣栓秽铭拆搏卿棘维数约简经典法综述维数约简经典法综述;;基本思想当数据在n维空间中线性不可分时，通过一个映射Φ将数据从n维空间映射到N（Nn）维空间中，使得数据在N维空间中是线性可分的，这样，再使用PCA或者LDA在N维空间中对数据进行降维时可以得到较好的结果。在实践中人们发现，当对数据进行处理时，经常会出现两个向量点积的形式，即出现Φ(Xi)TΦ(Xj)，用一个函数来代替这种点积计算，K(Xi，Xj) ;;基本思想是：根据数据点间的欧氏距离，构造关系矩阵，为了尽可能地保持每对观测数据点之间的欧氏距离，只需对此关系矩阵进行特征分解，从而获得每个数据在低维空间中的低维坐标。 ; ;;基本思想 ISOMAP通过测地线距离来描述各点之间的相互关系，在全局意义下，通过寻找各点在图意义下的最短路径来获得点与点之间的距离，然后利用经典的MDS算法得到低维的嵌入坐标。主要步骤构造一个连接邻域点的图计算最短距离D（ D描述样本点之间在流形上相对位置）应用MDS ;基本思想对一组具有流形的数据集，在嵌套空间与内在低维空间局部邻域问的关系应该不变，即在嵌套空间中每个采样点可以用它的近邻点线性表示，在低维空间中保持每个邻域中的权值不变，重构原数据点，使重构误差最小。主要步骤寻找每个样本点的k个近邻点每个样本点的近邻点计算该点的局部重建权值矩阵由该点的局部重建权值矩阵和其邻点计算该点的输出值;;