第9讲主成分分析2.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9讲主成分分析2

* * * * * * * * * * * * * * * * * * * * * 西南科技大学生命科学与工程学院周海廷制作 * 西南科技大学生命科学与工程学院周海廷制作 *  用PRINCOMP过程实现 主成分分析 例[3.1] 某医学院测得20例肝病患者的4项肝功能指标∶SGPT(转氨酶)、肝大指数、ZnT(硫酸锌浊度)和AFP(胎甲球),依次用X1至X4表示, 观测数据列入表3.1试进行主成分分析。 第1页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 方法一 1.打开SAS,在Tool菜单中打开表编辑器(Table Editor),建立数据表。 第2页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 2.在Solutions菜单中点开Analysis,在二级菜单中点击Analyst,调出分析家界面。 第3页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 3.在分析家界面中,打开前面已经建立的数据文件。 第4页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 4.在Statistics菜单中,点击Multivariate,在二级菜单中点击Principal Components。 第5页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 出现下面的对话框: 将x1-x4选入变量框中,点击OK 第6页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 第7页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 第8页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 方法二 编写程序: 第9页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * OPTIONS PS=500要求输出的结果中每页包括500行内容,可避免不必要的SAS标题反复出现。 PROC PRINCOMP表示用PRINCOMP过程进行主成分分析; OUT=aaa表示要产生1个数据集aaa,它包括原始数据以及与各观测值对应的4个主成分值; PREFIX=Z要求用Z1—Z4分别表示4个主成分变量; 若此项缺省,则SAS系统自动用PRIN1—PRIN4表示4个主成分变量。 第10页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 第2个数据步建立1个新数据集a2,其内容就是aaa,并利用求最大值函数MAX( )求出各样品所对应的4个主成分值中的最大值,赋给变量MAXZ。 最后由PRINT过程输出原始数据及各样品的主成分值、最大主成分值。 第11页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 结果解释 第12页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 相关矩阵的特征值(Eigenvalue),特征值越大,它所对应的主成分变量包含的信息就越多。第1个至第4个主成分的贡献率分别为42.9563%、 27.3384%、 24.5337%和5.1716%,最后1列为累计贡献率,由此列数值可知∶ 前3个主成分就包含了原来4个指标94.828%的信息。 第13页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 特征向量(Eigenvectors),据此可以写出由标准化变量所表达的各主成分的关系式: 第14页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 在各主成分的表达式中,各标准化指标xi前的系数与该主成分所对应的特征值之平根的乘积是该主成分与该指标之间的相关系数,如∶ 第15页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 第16页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 系数的绝对值越大,说明该主成分受该指标的影响也就越大。因此,决定第1主成分Z1大小的主要为X1和X2,即SGPT和肝大指数;决定第2主成分Z2大小的主要为X3,即ZnT; 决定第3主成分Z3大小的主要为X4,即AFP;决定第4主成分大小的主要为X1和X2,但作用相反。这提示(以专业知识为依据): Z1指向急性炎症;Z2指向慢性炎症;Z3指向原发性肝癌可疑;Z4贡献率很小,仅作参考,它可能指向其他肝病,如指向急性肝萎缩? 第17页/共26页 * 西南科技大学生命科学与工程学院周海廷制作 * 主成分的应用: 求出了主成分,并结合专业知识给各主成分所蕴藏的信息以恰当的解释,还应该利用它们来判断样品的特性,本例可据肝病患者的4个主成分值来为判断肝病类型提供参考。 为了求主成分值的方便,可将用标准化指标表达的主成分换成用原指标表达的形式,本例中: x1=(X1-138.000)/88.887866,x2=(X2-2.325)/1.054751,x3=(X3-15.000)/7.419746,x4=(X4-3

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档