- 10
- 0
- 约1.27万字
- 约 8页
- 2016-08-21 发布于湖北
- 举报
R语言多元分析系列
R语言多元分析系列R语言多元分析系列之一:主成分分析?主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是在处理观测数目小于变量数目时无法发挥作用,例如基因数据。R语言中进行主成分分析可以采用基本的princomp函数,将结果输入到summary和plot函数中可分别得到分析结果和碎石图。但psych扩展包更具灵活性。1 选择主成分个数选择主成分个数通常有如下几种评判标准:根据经验与理论进行选择根据累积方差贡献率?,例如选择使累积方差贡献率达到80%的主成分个数。根据相关系数矩阵的特征值,选择特征值大于1的主成分。另一种较为先进的方法是平行分析(parallel analysis)。该方法首先生成若干组与原始数据结构相同的随机矩阵,求出其特征值并进行平均,然后和真实数据的特征值进行比对,根据交叉点的位置来选择主成分个数。我们选择USJudgeRatings数据集举例,首先加载psych包,然后使用fa.paral
您可能关注的文档
最近下载
- 第一次月考达标测试卷(1-2单元)-2023-2024学年语文六年级下册统编版.docx VIP
- ICD-11 国际疾病分类编码标准(最新).docx VIP
- 财富大道——李显峰.pdf VIP
- 2023-2024学年上海市七宝中学高一下学期期中考试物理试卷含答案.pdf VIP
- [优质文档]卫宁软件电子病历系统5.0介绍-v2.0.ppt VIP
- 2025中烟工业机电类考试刷题提分专用试题及答案.doc VIP
- UN38.3标准-中文版文档.docx VIP
- 机械设计基础(第2版):平面机构的自由度与运动分析PPT教学课件.pptx VIP
- 一例凶险型前置胎盘的个案护理PPT.pdf VIP
- 灌浆资料整理软件用户手册.doc VIP
原创力文档

文档评论(0)