网站大量收购闲置独家精品文档,联系QQ:2885784924

主成分分析中的统计检验问题.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析中的统计检验问题

主成分分析中的统计检验问题文/ 傅德印摘 要: 主成分分析已经越来越成为人们广泛应用的多元统计分析方法。但应用中盲目套用主成分分析方法的情 况很多, 而对主成分分析的适用性, 主成分个数的合理性等 问题重视不够, 更谈不上对主成分分析进行统计检验。为 此, 为了更好应用主成分分析, 就应对主成分分析结果进行 统计检验并建立统计检验体系。主成分分析统计检验体系 主要包括: 主成分分析的适用性检验 ; 等 相 关 性 检 验 ; 主 成 分方差的假设检验和选取主成分数目检验。关键词: 主成分分析; 假设检验; 巴特莱特检验性组合, 是对原变量信息的一种提取, 主成分不增加总信息量, 也不减少总信息量, 只是对原信息进行了重新分配。从 主成分的应用上看, 求解主成分可以解决原始数据的相关 性问题, 可以实现数据的降维。正因为上述情况, 所以常导 致人们认为: 主成分分析的主成分数和原始变量数相等, 它 是将一组具有相关性的变量变换为一组独立的变量, 严格 上不能作为一个模型来描述, 它只能作为通常的变量变换, 是一种变量变换行为, 不涉及原来假设问题, 所以不需要进 行假设检验。事实上, 从理论上, 主成分分析包括总体主成分分析和 样本主成分分析, 在实际问题中, 总体协方差矩阵或相关矩 阵都是未知的, 都需要样本来估计, 就必然涉及统计检验问 题。而且在主成分分析的具体应用中, 变量变换是一种手 段, 变量变换的最终目的是为了根据实际情况, 最终要选择 重要的信息量( 即前几个主成分) , 以便在此基础上, 进行进 一步的分析。要进行这样的分析, 实际上隐含了原始变量中 存在着并且能够综合出重要信息的假设, 为此就需要对相 应的假设进行统计检验。二、主成分分析的统计检验体系( 一) 主成分分析适用性检验并非所有的截面数据都适用于主成分分析的。主成分 分析本身并不是目的, 实际应用中主成分分析往往是一种 手段。目的是通过主成分分析简化数据结构, 在此基础上进 行进一步的分析。因此, 使用主成分分析的前提条件是原始 数据各个变量之间应有较强的线性相关关系。如果原始变 量之间的线性相关程度很小, 它们之间不存在简化的数据 结构, 这时进行主成分分析实际是没有意义的。所以, 应用 主成分分析时, 首先要对其适用性进行统计检验。主成分分 析适用性检验的假设就是原始变量之间存在着较强的线性 相关。具体检验方法有:1、巴特莱特球性检验巴 特 莱 特 球 性 检 验 ( Bartlett test of sphercity) 是 从 整 个 相关矩阵出发进行的检验, 检验的原假设是相关矩阵为单主成分分析已经越来越成为人们广泛应用的多元统计分析方法。特别是在系统综合评价, 变量子集合的选择以及 主成分回归中都取得了大量的应用成果。但是, 应用中盲目 套用主成分分析方法的情况很多, 而对主成分分析的适用 性, 主成分个数的合理性等问题重视不够, 更谈不上对主成 分分析进行统计检验问题。为此, 本文拟对主成分分析的有 关统计检验问题, 如主成分分析是否需要统计检验? 若需要 则进行哪些检验? 检验怎样的假设? 如何进行这些统计检验 等问题进行探讨, 以便抛砖引玉, 供同行们做进一步研究。一、主成分分析是否需要统计检验主成分分析采取一种数学降维的方法, 找出几个综合 变量来代替原来众多的变量, 使这些综合变量能尽可能地 代表原来变量的信息量, 而且彼此之间互不相关。这种将多 个变量化为少数几个互不相关的综合变量的统计分析方法 就叫做主成分分析或主分量分析。从主成分的导出和计算上看, 主成分是从原始数据的 协方差矩阵或者相关系数矩阵出发, 根据主成分应该满足 的条件导出的。即主成分的协方差矩阵应该是一个对角矩 阵, 主成分表达式系数矩阵 A 应该是一个正交矩阵为条件, 导出主成分的协方差矩阵的对角线元素是协方差矩阵或相 关矩阵的特征值, 主成分的方差就是原始数据协方差矩阵或相关矩阵的特征值,主成分表达式系数就是协方差矩阵位矩阵,如果不能拒绝原假设, 说明原始变量之间相互独或相关矩阵特征值对应的特征向量。主成分是原变量的线立, 不适合进行主成分分析。事实上, 如果原始数据的相关然是不适合进行主成分分析的。巴特莱特球性检验的统计量。巴特莱特球性检验的理 论依据源于多元正态总体协方差矩阵的检验理论。协方差 矩阵的检验主要内容包括: 对总体协方差矩阵∑与已知矩 阵∑0 相等的检验, 对总体协方差矩阵∑中的元素是否均为已知协方差矩阵∑0 中元素的 !2 倍的检验, 以及检验多个总体的协方差矩阵都相等的检验等。其中, 对总体协方差矩阵∑中的元素是否均为已知协方差矩阵∑0 中元素的 !2 倍的 检验, 其原假设为, H0:∑=!2∑0,H1:∑≠!2∑

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档