- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
.
方法:
1利用Excel2000进行主成分分析
第一步,录入数据,并对进行标准化。
[例]一组古生物腕足动物贝壳标本的两个变量:长度和宽度。
图1原始数据和标准化数据及其均值、方差
〔取自张超、杨秉庚《计量地理学基础》
计算的详细过程如下:
⑴将原始数据绘成散点图〔图2。主持分分析原则上要求数据具有线性相关趋势——
如果数据之间不相关〔即正交,则没有必要进行主成分分析,因为主成分分析的目的就是用
正交的变量代替原来非正交的变量;如果原始数据之间为非线性关系,则有必要对数据进行
2
线性转换,否则效果不佳。从图2可见,原始数据具有线性相关趋势,且测定系数R=0.4979,
相应地,相关系数R=0.7056。
⑵对数据进行标准化。标准化的数学公式
这里假定按列标准化,式中
1nn
xx,(xx)2Var(x)
ijnijijijjij
i1i1
分别为第j列数据的均值和标准差,x为第i行〔即第i个样本、第j列〔即第j个变量的数
ij
x*xn25
据,为相应于的标准化数据,为样本数目。
ijij
图2原始数据的散点图
图3标准化数据的散点图
对数据标准化的具体步骤如下:①求出各列数据的均值,命令average,语法为:
average起始单元格:终止单元格。如图1所示,在单元格B27中输入
=AVERAGEB1:B26,确定或回车,即得第一列数据的均值x10.88;然后抓住单元格
1
B27的右下角〔光标的十字变细右拖至C27,便可自动生成第二列数据的均值x10.68。
2
②求各列数据的方差。命令varp,语法同均值。如图1所示,在单元格B28中输入
=VARPB2:B26,确定或回车,可得第一列数据的方差Var(x)19.4656,右拖至C28生
1
成第二列数据的方差Var(x)23.0976。
2
③求各列数据的标准差。将方差开方便得标准差。也可利用命令stdevp直接生成标准
差,语法和操作方法同均值、方差,不赘述。
④标准化计算。如图1所示,在单元格D2中输入=B2-$B$27/$B$29,回车可得第一
列第一个数据3的标准化数值-1.786045,然后按住单元格D2的右下角下拖至D26,便会生
成第一列数据的全部标准化数值;按照单元格D2的右下角右拖至E2,就能生成第二列第
一个数据2的标准化数据-1.806077,抓住单元格E2的右下角下拖至E26便会生成第二列
数据的全部标准化数值。
⑤作标准化数据的散点图〔图3。可以看出,点列的总体趋势没有变换,两种数据的相关
系数与标准化以前完全相同。但回归模型的截距近似0,即有a0,斜率等于相关系数,
即有bR。
原创力文档


文档评论(0)