实例说明利用Excel进行主成分分析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

.

方法:

1利用Excel2000进行主成分分析

第一步,录入数据,并对进行标准化。

[例]一组古生物腕足动物贝壳标本的两个变量:长度和宽度。

图1原始数据和标准化数据及其均值、方差

〔取自张超、杨秉庚《计量地理学基础》

计算的详细过程如下:

⑴将原始数据绘成散点图〔图2。主持分分析原则上要求数据具有线性相关趋势——

如果数据之间不相关〔即正交,则没有必要进行主成分分析,因为主成分分析的目的就是用

正交的变量代替原来非正交的变量;如果原始数据之间为非线性关系,则有必要对数据进行

2

线性转换,否则效果不佳。从图2可见,原始数据具有线性相关趋势,且测定系数R=0.4979,

相应地,相关系数R=0.7056。

⑵对数据进行标准化。标准化的数学公式

这里假定按列标准化,式中

1nn

xx,(xx)2Var(x)

ijnijijijjij

i1i1

分别为第j列数据的均值和标准差,x为第i行〔即第i个样本、第j列〔即第j个变量的数

ij

x*xn25

据,为相应于的标准化数据,为样本数目。

ijij

图2原始数据的散点图

图3标准化数据的散点图

对数据标准化的具体步骤如下:①求出各列数据的均值,命令average,语法为:

average起始单元格:终止单元格。如图1所示,在单元格B27中输入

=AVERAGEB1:B26,确定或回车,即得第一列数据的均值x10.88;然后抓住单元格

1

B27的右下角〔光标的十字变细右拖至C27,便可自动生成第二列数据的均值x10.68。

2

②求各列数据的方差。命令varp,语法同均值。如图1所示,在单元格B28中输入

=VARPB2:B26,确定或回车,可得第一列数据的方差Var(x)19.4656,右拖至C28生

1

成第二列数据的方差Var(x)23.0976。

2

③求各列数据的标准差。将方差开方便得标准差。也可利用命令stdevp直接生成标准

差,语法和操作方法同均值、方差,不赘述。

④标准化计算。如图1所示,在单元格D2中输入=B2-$B$27/$B$29,回车可得第一

列第一个数据3的标准化数值-1.786045,然后按住单元格D2的右下角下拖至D26,便会生

成第一列数据的全部标准化数值;按照单元格D2的右下角右拖至E2,就能生成第二列第

一个数据2的标准化数据-1.806077,抓住单元格E2的右下角下拖至E26便会生成第二列

数据的全部标准化数值。

⑤作标准化数据的散点图〔图3。可以看出,点列的总体趋势没有变换,两种数据的相关

系数与标准化以前完全相同。但回归模型的截距近似0,即有a0,斜率等于相关系数,

即有bR。

文档评论(0)

Yxq927 + 关注
实名认证
文档贡献者

三更灯火五更鸡,正是男儿读书时

1亿VIP精品文档

相关文档