网站大量收购独家精品文档,联系QQ:2885784924

多元统计学讲解.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用主成分分析法对污染物进行分析 摘要:主成分分析法是统计学中常用的统计分析方法,主要是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标.此文中我们利用SPSS软件对主要城市的废水污染物的排放情况,通过主成分分析的方法进行统计分析,进而再通过聚类,根据主要城市的废水污染物对城市进行分类. 关键字:主成分分析,聚类,废水污染物,SPSS Abstract: Principal component analysis is a statistical method commonly used in the statistical analysis, which makes many indexes be less ones with a few information lost. In this paper, we use SPSS software for wastewater pollutant emissions in major cities, applying statistical analysis by using principal component analysis, and then clustering cities into several groups according to the citys main water pollutants. Key Words: Principal component analysis, Clustering, Wastewater pollutants, SPSS 1.引言 主成分分析(principal component analysis)也称主分量分析,由霍特林( Hotelling )于1933年首先提出.主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法.通常把转化后的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能.这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率.由于主成分分析的这些优势,在实际问题中遇到指标较多且各指标相关关系较大时,人们常考虑应用主成分分析的方法. 河流中污染物的含量一直是环境资源问题的研究热点,本文正是通过多元统计学中的主成分分析的分析方法来对废水中的污染物的排放情况进行分析,然后通过聚类分析对这些主要城市进行分类.2. 基本原理 2.1主成分分析的基本原理 在对某一事物进行实例研究中,为了更全面的、更准确地反应事物的特征及其发展规律,人们往往要考虑其有关系的多个指标,一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性.由于各指标是对同一事物的反映,不可避免地造成信息地大量重叠,基于此,主成分分析研究通过原来变量地少数几个线性组合来反应原理指标的信息,相互之间又尽可能不含重复信息. 2.1.1 主成分的求法 设总体 现在寻求新的综合指标.其基本思想是:找出个分量的一个线性组合,为使尽可能的反映的变化情况,就是要使具有最大的方差.继而找出的各分量的第二个线性组合,为使和相互之间尽可能不含重复信息,又能尽可能多的反映的信息,就要是在与不相关的条件下具有最大的方差,如此继续下去,直到的信息基本提取完毕为止.这些新的综合指标,等就称为的主成分. 由协方差阵是一个非负定矩阵,现在寻求使得的方差达到最大,且.这是一个条件极值问题:利用拉格朗日乘数法,令得,可见是长度为1的特征值.此时,所以应取为的最大特征根,且应取为相应于的单位化的特征向量,因此为的第一主成分.同样要求达到最大,其中且,问题归结为求解与前面类似,求得应取为相应于的第二大特征根所对应的单位特征向量,从而求得的第二主成分.以此类推,求得的k个主成分. 2.1.2 主成分求解步骤 求的协方差阵的特征根,记为 求对应的单位特征向量(因为对称阵,故不同特征根对应的特征向量比正交). 取即为的第个主成分,. 注意,若,则可得的个主成分,当有重根时,主成分不惟一. 值得注意的是,的主成分是由的分量的特殊线性组合而得,如果各分量的单位(即量纲)不同,那么这种线性组合要解释其含义就很困难了,而且当某一个变量改变其计算单位后,协方差阵就会改变,自然相应的的特征根、特征向量也随之改变,最后导致主成分的改变.为了清除变量间不同单位的影响,通常是先把各变量标准化,即坐如下变换,令 其中,.注意到的协方差阵实际上是的相关矩阵,即,其中,为变量与的相关系数.对实行求主成分的步骤(1)~(3),所得的主成分成为标准主

文档评论(0)

我是兰花草 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档