- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析相关理论及操作
主成分分析
一:所用软件: spss19.0
Graphpad Prism 5.0
Bioedit v7.1.3
二:主成分分析原理:主成分分析(Principal Component Analysis)就是考虑各指标之间的相互关系,利用降维的方法将多个指标转换为少数几个互不相关的指标,从而使进一步研究变得简单的一种统计方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降维”的思想,在损失很少信息的前提下把多个指标转化为几个综合指标,称为主成分。分类变量和连续变量均可以参与两步聚类分析。
每个主成分均是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。主成分分析不能看作是研究的结果,而应该在主成分分析的基础上继续采用其他多元统计方法来解决实际问题。
三:实验操作过程
1.数据的处理:利用bioedit,计算出37株重症和44株非重症EV71病毒株的序列与EV71 Brcr株的相似度;为了研究是否区域中的碱基(A,T,G,C)含量不同队区分重症和非重症有意义,所以利用bioedit计算出EV71病毒13个区域(vp1-vp4,2A-2C,3A-3C,3UTR,5UTR),各个区域中个病毒株的不同碱基的含量。
2.spss19.0主成分分析过程及参数的设置
第一步:录入或调入数据
第二步:打开“因子分析”对话框。
沿着主菜单的“Analyze→Data Reduction→Factor”的路径打开因子分析选项框。
第三步:选项设置。
首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中。在本例中,全部13个变量都要用上,故全部调入。因无特殊需要,故不必理会“Value”栏。下面逐项设置。
⒈ 设置Descriptives选项。
单击Descriptives按钮,弹出Descriptives对话框。
图5 描述选项框
在Statistics栏中选中Univariate descriptives复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。
在Correlation Matrix栏中,选中Coefficients复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant复选项,则会给出相关系数矩阵的行列式,如果希望在Excel中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。
设置完成以后,单击Continue按钮完成设置。
需要注意的是:主成分计算是利用迭代(Iterations)方法,系统默认的迭代次数是25次。但是,当数据量较大时,25次迭代是不够的,需要改为50次、100次乃至更多。对于本例而言,变量较少,25次迭代足够,故无需改动。
设置完成以后,单击Continue按钮完成设置。
⒊ 设置Scores设置。
选中Save as variables栏,则分析结果中给出标准化的主成分得分(在数据表的后面)。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回归”(Regression)法即可。
选中Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。
设置完成以后,单击Continue按钮完成设置。
第四步:结果分析(只列出本实验研究目的相关的内容作解释)
1.在Total Variance Explained(全部解释方差) 表的Initial Eigenvalues(初始特征根)中,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根λ,因此可以直接根据特征根计算每一个主成分的方差百分比(% of Variance)。由于全部特征根的总和等于变量数目,即有m=∑λi=8,故第一个特征根的方差百分比为λ1/m=3.755/8=46.939,第二个特征根的百分比为λ2/m=2.197/8= 27.459,……,其余依此类推。然后可以算出方差累计值(Cumulative %)。在Extraction Sums of Squared Loadings,给出了从左边栏目中提取的三
文档评论(0)