实验八 主成分分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课 时 授 课 计 划 课次序号: 20 一、课  题:实验八 主成分分析 二、课  型:上机实验 三、目的要求: 1.能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别; 2.掌握利用主成分分析的SAS过程解决有关实际问题. 能根据SAS输出结果选出满足要求的几个主成分. 四、教学重点、教学难点: 理解标准化主成分与原始数据主成分的区别,会求主成分,能解释主成分的含义,即给综合指标以解释. 五、教学方法及手段:传统教学与上机实验相结合. 六、参考资料:1.《实用统计方法》,梅长林,周家良编,科学出版社; 2.《SAS统计分析应用》,董大钧主编,电子工业出版社. 七、作业: 4.5 4.6 八、授课记录: 授课日期 班  次 九、授课效果分析: 实验八 主成分分析 (1学时) 一、实验目的和要求 能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别; 能根据SAS输出结果选出满足要求的几个主成分. 二、实验内容 1.主成分分析的SAS过程—PROC PRINCOMP过程 PROC PRINCOMP过程即可以从原始观测数据集出发,也可从相关系数或协方差矩阵出发做主成分分析.默认输出结果包括相关系数矩阵或协方差矩阵,其正交单位化特征向量及特征值,各主成分的贡献率等.另外,还可以按要求输出各主成分的观测值(主成分得分)等. 基本语句形式: PROC PRINCOMP DATA=SAS数据集1 OUT=SAS 数据集2 OUTSTAT=SAS 数据集3 COV N=n PREFIX=name; /* 指出要进行分析的SAS集名称、输出集等 */ VAR 变量名称; /* VAR后面列出数据集中参与主成分分析的变量名称,若省略此句,则被分析数据集中所有数值变量均参与分析*/ RUN; PROC PRINCOMP后面选项: DATA=SAS数据集1:指出要分析的SAS数据集名称.可以是原始观测值的SAS数据集,也可以是相关系数矩阵或协方差矩阵.若是后者,需要在数据集名称后加上“(type=corr)”或“(type=cov)”.若省略此句,则自动分析最新建立的SAS数据集. OUT=SAS 数据集2:命名一个输出SAS数据集,包括原始数据以及各主成分得分(即主成分的观测值).若输入的数据是相关系数矩阵或协方差矩阵,则不能生成该数据集. OUTSTAT=SAS数据集3:命令一个包含变量的均值、标准差、相关系数矩阵或协方差阵、特征值、特征向量的输出SAS集. 注意:当输入矩阵为相关系数或协方差矩阵时,为创建OUTSTAT数据集3需要指定两个新的字符变量“_TYPE_”和“_NAME_”,一般在输入数据集语句后根据输入数据是相关系数或协方差矩阵分别写上“_TYPE_=CORR” “_TYPE_=COV”,而在“INPUT”语句后面添加变量“_NAME_ $ ”,其取值可指定为输入的变量名.这时OUTSTAT数据集3就包含一个由输入变量和用“_NAME_ ”变量命名的变量之间的相关系数或协方差矩阵. COV:要求从协方差矩阵出发做主成分分析.若省略此项,则从相关系数矩阵出发做主成分分析. N=n: 指定要计算的主成分个数.默认值为参与分析的变量个数. STD:要求在out=的数据集里把主成份得分标准化为单位方差.如果没有规定此项, 主成份得分的方差等于相应的特征值. NOINT:要求在模型中不含截距. NOPRINT:不打印输出分析结果. 注意:命令大小写一样. 2.总体主成分分析 (1)基于协方差矩阵的总体主成分的求法 —维随机变量, 协方差阵 非负定. 主成分定义: 满足:(1)系数向量单位化; (2)各主成分不相关,无重叠信息,; (3)主成分方差由此递减. 求总体主成分步骤: 1)解,求的p个特征值; 2)对应的正交单位化的特征向量分别为; 其中 , 3)的第个主成分为 ; 为个主成分构成的随机向量,则,其中 为正交矩阵, 且 故主成分向量的协方差阵为 各主成分的总方差 4)主成分的贡献率与累计贡献率 ——第k个主成分的贡献率 它反映了第k个主成分提取全部信息的多少 ——前k个主成分的累积贡献率 它反映了前k个主成分共同提取全部信息的多少. (2)基于相关系数矩阵的主成分分析——标准化变量的主成分 对标准化随机向量作主成分分析即为基于相关系数矩阵的主成分分析,由标准化 ,,则. 令,,的协方差矩阵 恰为的相关系数矩阵,以代替即可. 主成分分析步骤(略): 例4.1 设随机向量协方差矩阵为, (1)从协方差矩阵

文档评论(0)

lingyun51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档