主成份分析与层次分析概2.doc

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成份分析与层次分析概2

浅谈主成分分析和因子分析的异同 【摘要】 在构建有众多指标的评价体系时,为了防止因为人为、主观地想法去掉或保留那些具有相关关系的指标,需要使用科学、客观的办法加以处理。在多元统计分析中的综合评价,是指对评价对象的多个方面信息加以汇集,从而在整体上以定量的形式确定评价对象的优劣水平与次序的过程。综合评价问题涉及到经济、社会、教育、技术等诸多领域,解决综合评价问题的重要方法之一是对多个变量进行综合处理的多元统计分析。本文将统计学中专门用来处理多指标、复杂相关等问题的多元统计分析方法运用到综合评价中。多元统计分析是通过运用数理统计的方法来研究多变量问题的理论和方法,它包括回归分析、判别分析、聚类分析、主成分分析、因子分析等方法,1928年发表的《关于多兀IF.态总体样本协方差阵的精确分布》,是学术界公认的多元统计分析的开端,在这个基础上、、等人又进行了有力的补充,从而使得多元统计分析理论知识得到了逐渐的完善,因而得到了快速发展,在许多领域中也有了实际应用。其中主成分分析和因子分析是两种最有价值和经常用到的方法,但很多研究者在进行数据分析时,经常将主成分分析和因子分析这两种方法混淆,因此,本篇文章通过对这两种方法的基本思想、操作应用、原理分析及在实例研究中相同点和不同点进行了比较和分析,归纳了这两种方法之间的异同之处,加深了对两种方法的了解与运用,从而可以让研究者们能够更好的运用恰当的方法,使它服务于某一项科学研究的目的,在经济,社会等广泛进行数据分析和应用。本文主要介绍了多元统计分析方法中的主成分分析方法和因子分析法以及它们在生活中的应用。先分别介绍了这两种多元统计分析方法的理论基础及其应用实例,再着重介绍了这两种方法的联系与区别,最后通过实例更加清晰的展现出两种容易让人混淆的方法的异同点。 【关键词】主成分分析 因子分析 联系 检验标准 问题的提出 在科学研究的各个领域中,经常需要观测大量的能反映某一事物的多个指标(这种指标在数学上通常被称为变量),收集大量的数据以便能够进行分析并从中寻找到一定的规律。多变量的大样本无疑会为科学研究提供丰富的信息,但是在考虑多变量的问题时,由于在众多变量中往往存在着一定的相关性,会使得观察者观测到的数据所反映出的信息存在重叠的现象,以至于增加了问题分析的复杂性,也会给分析带来很多的不便。如果基于这些众多具有相关关系的指标体系进行综合评价,将会导致评价结果的不可靠,这是因为由原始指标观测所得到数据阵的阶数较大,而且矩阵的性质又往往呈现病态,给数值计算和计算机数据处理带来了不稳定性,影响数据统计分析和实证分析的结果。如果单独分析指标,分析很可能是孤立的并不是综合起来考虑的,如果盲目的减少指标会损失很多的信息,也会很容易产生错误的结论,因此我们要设法运用较少的综合指标来分别综合存在于各个变量中的各种信息,在多元统计分析方法中,往往会由于变量的个数太多,同时他们之间彼此可能会存在着一定的相关性,从而样本信息会产生叠加。而且如果当变量较多的时候,如果在高维空间中研究样本的分布规律会比较困难,也会使得分析的过程更加复杂。因此主成分分析和因子分析这两种方法是为解决此问题而产生的,两种方法都起到抓住事物主要方面、简化模型结构的作用.,都是将相关的指标转化成无关指标,以便有助于消除由于原指标变量相关而产生的信息重叠,使复杂问题简单化。而且它们都是通过用较少的综合变量来代替原来较多的变量,并且综合变量之间是互不相关的,在数学上,是用来处理降维的方法,通过利用这种降维的思想以便达到简化统计分析的目的。近年来,这两种方法在经济、社会等问题研究中的应用也越来越多,应用的范围也更加的广泛。因子分析被称为是主成分分析的推广与发展,即在二者之间一定存在和许多的共同之处,才会导致很多研究者在使用这两种方法时经常会出现一些容易混淆的错误,这难免会让人们对分析出的结果产生质疑。因此我们有必要将这两种方法将这两种方法加以严格的区分,同时针对实际问题选择出正确的方法。因为在实际应用中,只有我们对所研究问题和方法的基本内涵有一定准确的理解和把握,才能更好的为科学决策服务,更能体现出统计分析方法的威力,对经济、社会进行更有效的分析、评价。本文与导师一同进行商榷和探讨,阐述个人看法,以供参考。 主成分分析详情 2.1 研究背景和发展历史: 1901年Karl Pearson针对非随机变量的讨论最早引进主成分的概念,之后在1933年著名的数学家Hotelling将它推广到随机向量的领域.这种方法的思想是在不丢失主要信息的原则下,通过线性组合把相互关联的原始变量用不相关的新变量表示出来;衡量信息量的主要指标是主成分的方差,方差越大,说明主成分包含的信息量越大。 2.2 基本思想: 从基本思想上来看,

您可能关注的文档

文档评论(0)

ochengaj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档