气候变量场时空结构的分离.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
气候变量场时空结构的分离

气候变量场时空结构的分离 第一部分 主成分分析(PCA) 经验正交函数分解(EOF) PCA基础 有关PCA的背景知识 大气科学中最常用的多变量统计方法——主成分分析(principal component analysis, PCA); 该方法因Lorenz(1956)年的文章而流行于大气科学分析 Lorenz称其为经验正交函数(empirical orthogonal function)分析; 两种名称对应的是同一种统计方法,但通常称其为因子分析是不正确的,两者之间虽有联系,但为不同的多变量统计方法。 PCA的定义 PCA是将包含有大量变量的数据集减少至仅包含较少变量的新数据集,即降维 这些新的变量是原变量的线性组合; 这些线性组合代表了原数据集最大的变化部分,即方差最大; 即对于数据x,容量为( ),即K个变量,每个变量有一个观测值,由PCA可以得到新数据u,容量为( ),且新数据(或新矢量)u是原矢量x的线性组合。 PCA的定义 当 时,PCA非常有效的实现了对数据的压缩处理 通常这样的情况发生在原数据变量之间存在相关,因此变量中包含有多余的信息; 新的矢量u中的元素称之为主成分(principal component, PC)。 PCA的作用 大气以及其它地理场变量间通常具有一定的相关性; 通过PCA可以压缩变量个数,并尽可能的表征原变量的变化; 不仅如此,PCA也是非常有效的探询多变量数据集的变化特征,如地理场的变化特征; 从而,PCA可以分析单场或多个变量场的时空变化特征。 PC的导出 原变量 ,容量为n,线性组合成一个新变量: 并使它具有极大的方差,即 PC的导出 上式可写为: 即 约束条件: 利用求解函数的条件极值法有(拉格朗日乘数法): 为拉格朗日乘子 PC的导出 根据微积分学求极值方法有: 即: 等价于: 关于PC 通常为了便于计算PCs,将原数据转为距平序列, 第一个PC, 是 的线性组合,且具有最大的方差; 以此类推,主成分 也是 的线性组合,且其方差为由大到小变化; PC之间满足条件:彼此正交,即彼此无关。 特征矢量(eigenvector) 与特征值(eigenvalue) 对于方阵 ,它的一个特征值 为标量,一个特征矢量 为非零矢量,则满足方程: 且有约束条件: 特征矢量(eigenvector) 与特征值(eigenvalue) 若方阵 为对称阵,则矢量 彼此正交,即: 具有单位长度的正交矢量称为标准正交矢量,类似于谐波分析中的sine和cosine函数的正交性; 特征矢量(eigenvector) 与特征值(eigenvalue) 特征值就是主成分的方差; 通常主要计算实对称矩阵的特征值和特征矢量,如协方差阵和相关阵。 新变量u 对于新PC,即矢量u,其元素 能表征原变量x的最大联合变化部分; 对于第m个PC,有: 其中, 为协方差阵[S]的特征矢量; 新变量u 将每个变量的观测值由1个扩展到n个,即[X],该矩阵包含有n列; 几何上,第一个特征矢量定出k维空间的方向(坐标),且对应于最大的特征值; 第二个特征矢量垂直于第一特征矢量,且对应于第二大特征值; 第三个特征矢量正交于前两个特征矢量,且对应于第三大特征值; ……… 新变量u 新变量矢量还可以写为: 其中[E]为正交方阵,包含有K个特征矢量列; 对于不同的数据,新坐标也不同,这是由于这些坐标是通过样本的协方差矩阵得到; 特征矢量又称为经验正交函数(empirical orthogonal functions, EOFs),区别于理论正交函数,如Fourier谐波函数。 新变量u的协方差阵 PC的特征之一:彼此独立 则新变量u的相关阵为单位阵[I]; 新变量的协方差均为0,因此协方差阵为对角阵; 协方差阵为对角阵的特点也可通过原变量协方差阵对角化得到: 解释方差 上式中 也为特征值矩阵; 则对应于第m个PC的方差为第m个特征值: 则第m个PC的解释方差为: 重构原变量 对于方程 ,如果[E]包含有所有K个特征矢量,假定 为非奇异矩阵; 则新变量u必定也包含有K个变量; 依据正交方阵具有特点: 则有合成公式: 若M=K,则通过上式可以完全重构出原数据。 重构原变量 如果MK,则有: 即近似重构,截断合成公式 PC与原变量场的相关 由于PC是原多个变量的线性组合,因此,若其对应的特征矢量不为0,则每一个PC与原多个变

文档评论(0)

学习让人进步 + 关注
实名认证
文档贡献者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档