- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验指导三主成分分析.doc
上机实验指导二:主成分分析
实验目的:能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别;能根据SAS输出结果选出满足要求的几个主成分。
在实际问题中,为了尽可能完整地获取有关的信息,往往需要考虑众多的变量,这虽然可以避免重要信息的遗漏,但增加了分析的复杂性。
同一问题所涉及到的众多变量之间会存在一定的相关性,这种相关性会使各变量的信息有所“重叠”。
人们自然希望通过克服相关性、重叠性,即对这些彼此相关的变量加以“改造”,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,从而通过对为数较少的新变量的分析达到解决问题的目的。
这实际上是一种“降维”的思想。
成分分析也称主分量分析,是由Hotelling于1933年首先提出的。
由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。
当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,……,直到所提取的信息与原指标相差不多时为止。这就是主成分分析的思想
主成分分析着眼于考虑变量的“分散性”信息,主要目的是对原变量加以“改造”,在不致损失原变量太多信息的条件下尽可能地降低原变量的维数,即用较少的“新变量”代替原来的各变量,即:(1)变量的降维;(2)主成分的解释。
一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;
因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。
主成分的贡献率与累计贡献率:实用中, 要求累计达到80%~90%的前m个主成份,既能降维又不损失原始变量中的太多信息
实际应用一般是求样本主成分:
五、实验步骤:
(一)过程格式
proc princomp选项;
var变量表;
partial 变量表;
freq 变量;
weight变量;
by变量;
(二)语句说明
proc princomp语句选项DATA=输入数据集,可以用type=cov或type=corr指明数据类型 ,data=new (type=corr) ; 表明 new 为一相关系数(corr)数据集.
out=输出数据集,存储原始数据和主分量得分等 .
outstat=输出数据集,存储变量的平均数、标准差、相关系数、特征值、特征向量等。
Cov指定要求从协方差阵出发计算主成份。缺省为从相关阵出发计算。
N=指要计算的主成份个数。缺省时全算。
STD 要求在OUT=的数据集中把主成份得分标准化为单位方差。不规定时方差为相应特征值。
Noint不含截距;
Noprint不输出分析结果 .
Var语句指明分析的数值变量 .
Partial语句指明偏相关或协方差矩阵进行分析的数值变量.
六、应用:
1999年我国经济发展情况分析
1999年我国的经济出现了良好的发展势头。下面我们选取全国31个省市自治区的八项指标(见表1),利用国际先进软件SAS对我国1999年经济发展情况作主成分分析
表1 1999年全国31个省市自治区经济发展基本情况
? 国内生产
总值 居民消
费水平 固定资
产投资 职工平
均工资 货物周
转量98 居民消费
价格指数 商品零售价格指数
工业总产值 省份 亿元 元 亿元 元 亿吨公里 % % 亿元 ? x1 x2 x3 x4 x5 x6 x7 x8 北京 2174.46 5784 1171.16 14054 333.8 100.6 98.9 1999.97 天津 1450.06 5551 576.45 11056 365.9 98.9 97.5 2261.49 河北 4569.19 2312 1770.47 7022 1952.5 98.1 97.8 2994.58 山西 1506.78 1833 477.57 6065 762.4 99.6 96.8 1096.83 内蒙 1268.2 2279 348.22 6347 759.5 99.8 97.7 640.68 辽宁 4171.69 4128 1119.47 7895 1229.9 98.6 96.1 3390.14 吉林 1669.56 3132 500.02 7158 464.8 98 96.7 1366.92 黑龙 2897.41 3431 751.66 7094 844 96.8 96.1 1854.57 上海 4034.96 10328 1855.76 16641 206.3 101.5 97.3 5452.91 江苏
您可能关注的文档
最近下载
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第八集完整中英文对照剧本.docx VIP
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第七集完整中英文对照剧本.docx VIP
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第六集完整中英文对照剧本.docx VIP
- Unit 4 School days(Grammar) 课件 -2024-2025学年《英语》 七年级上册(译林版).pptx VIP
- 2024年四川省高考数学试卷(含答案解析)文科+理科.docx
- 中国助洗剂项目商业计划书.docx
- The Summer I Turned Pretty《我变美的那夏天(2022)》第二季第四集完整中英文对照剧本.docx VIP
- 中国硫酸黏菌素类产品项目商业计划书.docx
- 中国化学纤维制造项目创业计划书.docx
- 2025年中国四氯化锆项目投资计划书.docx
文档评论(0)