改进主成分分析(PCA)鲁棒性的算法比较.pdfVIP

改进主成分分析(PCA)鲁棒性的算法比较.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第31卷 第7期 (下) 赤 峰 学 院 学报 (自然科 学版 ) V01.3lNo.7 2015年 7月 JournalofChifengUniversity(NaturalScienceEdition) Ju1.2015 改进主成分分析(PCA)鲁棒性的算法比较 叶明喜,黄 钰,蒋 昊 (兰州商学院,甘肃 兰州 730101) 摘 要:与传统的PCA算法相比较,基于分布特征算法的主成分分析,由于量测的不精确使特性或参数的实际值会偏离 它标称值 。另一个是受环境因素影响而引起特性或参数的缓慢漂移,这样得到的分析结果在很大程度上受到异常值的干扰. 本文通过对比几种算法。提出改善主成分分析(PCA)算法鲁棒性的一种实现途径,去除或者减少异常点影响,以提高PCA的 精度 . 关键词:主成分分析;PCA鲁棒性;标称值;异常点;马氏距离 中图分类号:TP391 文献标识码:A 文章编号;1673—260X(2015)07—0017-03 1 PCA的原理和鲁棒性 另外,传统PCA算法基于协方差阵的二阶方面考虑,因 传统PCA算法是一种基于空间坐标的降维技术,将 此得到的主成分只能做到互不相关,而不能做到相互独立. 高维数据按照线性投影的方式投影到低维空间,在保留过程 为提高PCA算法的鲁棒性,必须去除或者减少异常点样本 变量间关系结构的同时,去除了噪声以及变量之间的相关 污染对算法的影响.异常点的产生原因是多方面的,例如突 性,但传统主成分基于特征值分解的PCA方法存在严重鲁 发的随机噪声,测量或者记录的偶尔出错等等.很自然地要 棒性问题,这大大影响了PCA的运算精度.如PCA算法给出 考虑如何找出样本集中的异常点样本,在求解协方差矩阵时 巩在随机向量X的第 i主方向,根据尽可能地靠近原始数据 将其排除在外.因此首先需要确定异常点样本的判据,下文 x,则所有的ai都应该调整大道 MSE,则有下列公式: 的三种算法判别异常点样本将作比较介绍. ai=argmax{E(vlx)l i=l,2,3… (1) 算法一 :计算原始数据在每个高维空间中的马 氏 (Mahalanobis)距 离 .给 出马 氏距离计算公式为 :d~-,- 其中:vlvi=0,i≠j;x为n维的零均值的随机向量,若给定 ,_——:——————。=_ 一 个数据集{xl,i=l,2,3…n;求的x的相关系数解为: V 一x rl(xr—x),Q 是协方差的逆矩阵.马氏距离的优点是 1 考虑到各变量之间相关性,并且与各变量的单位无关.对数 = 兰丁 x娲,=1,2,…m), 儿 - t J 据点的马氏距离设定一个标称值8,对原始数据与马氏距离 协方差矩阵: 进行排序,对与该标称值的点进行不同大小比较并进行标 var∞=AX)(rAT_A, 记剔除,从而使这些异常点不会被选人进行成分分析,从而 矩阵A为构造的正交阵,传统PCA算法是对随机向量 做到将异常点样本剔除目的. x的协方差阵进行特征值分解来获得 x的协方差矩阵val 算法二:是开始设定一个可能的参考异常值,初始化时 ∞,其为一对角矩阵,而对角元素恰好是原始数据集相关矩 将第一个点和第二点之间的马氏距离作为标称值,将所有 阵的特征值.其中样本数据集协方差阵的估计值: 点计算出到均值点的马氏距离 ,计算出样本点中大于参考 A 1

文档评论(0)

lizhencai0920 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档