维数约简经典法综述.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
维数约简经典法综述

2011年12月5日;研究背景 经典方法介绍 ;举例 处理200个256*256的图片时,通常我们将图片拉成一个向量,这样,得到了65536*200的数据,直接处理数据? 维数灾难 巨大的计算量将使我们无法忍受 数据本质 过多的数据量,不能反映出数据的本质特征,如直接对这样的数据进行处理,很难得到理想结果 ;基本原理 高维输入空间通过线性或非线性映射投影到一个低维空间,从而找出隐藏在高维观测数据中有意义的低维结构 原始数据大量冗余 根据变量相关性 几何观点 研究重点 保留核心信息;方法:线性和非线性 线性:PCA LDA 基于核函数:KPCA 基于特征值的非线性方法:MDS ISOMAP LLE ;思想: 找出最能代表原始数据的投影方法 如果理解? 维数约简后的数据不能失真 除掉噪声、冗余数据 ;PCA实现的关键 降噪:使留下的维度间的相关性尽可能小 去冗余:使留下来的维度含有的“能量” 尽可能大 协方差矩阵 对角化;形成样本矩阵,将样本中心化 计算样本矩阵的协方差矩阵 对协方差矩阵进行特征值分解,选取最大的p个特征值对应的特征向量组成投影矩阵 对原始样本进行投影,得到维数约减后的新样本矩阵;注意:PCA属于非监督 基本思想:投影。 首先找出特征向量,把这些数据投影到一个低维的方向,使得投影后不同的类之间尽可能的分开,而同一类内的的样本比较靠近,然后在新空间中对样本进行分类。 ;躯瓮聚霞长绰眯杯名潦售喻栏皑做斟龙麓郎乘霍眷嫌诸鸣栓秽铭拆搏卿棘维数约简经典法综述维数约简经典法综述;;基本思想 当数据在n维空间中线性不可分时,通过一个映射Φ将数据从n维空间映射到N(Nn)维空间中,使得数据在N维空间中是线性可分的,这样,再使用PCA或者LDA在N维空间中对数据进行降维时可以得到较好的结果。 在实践中人们发现,当对数据进行处理时,经常会出现两个向量点积的形式,即出现Φ(Xi)TΦ(Xj),用一个函数来代替这种点积计算,K(Xi,Xj) ;;基本思想是:根据数据点间的欧氏距离,构造关系矩阵,为了尽可能地保持每对观测数据点之间的欧氏距离,只需对此关系矩阵进行特征分解,从而获得每个数据在低维空间中的低维坐标。 ; ;;基本思想 ISOMAP通过测地线距离来描述各点之间的相互关系,在全局意义下,通过寻找各点在图意义下的最短路径来获得点与点之间的距离,然后利用经典的MDS算法得到低维的嵌入坐标。 主要步骤 构造一个连接邻域点的图 计算最短距离D( D描述样本点之间在流形上相对位置) 应用MDS ;基本思想 对一组具有流形的数据集,在嵌套空间与内在低维空间局部邻域问的关系应该不变,即在嵌套空间中每个采样点可以用它的近邻点线性表示,在低维空间中保持每个邻域中的权值不变,重构原数据点,使重构误差最小。 主要步骤 寻找每个样本点的k个近邻点 每个样本点的近邻点计算该点的局部重建权值矩阵 由该点的局部重建权值矩阵和其邻点计算该点的输出值;;

您可能关注的文档

文档评论(0)

gm8099 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档