语言中主成分分析在层次聚类分析中的应用.pptxVIP

语言中主成分分析在层次聚类分析中的应用.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

20XXR语言中主成分分析在层次聚类分析中的应用

R语言中主成分分析在层次聚类分析中的应用目录

R语言中主成分分析在层次聚类分析中的应用R语言中主成分分析在层次聚类分析中的应用多维数据进行层次聚类的缺点主要有?计算时间复杂度大?。每次都要计算多个cluster内所有数据点的两两距离?得到的聚类结果是局域最优,不一定是全局最优?。层次聚类使用的是贪心算法

R语言中主成分分析在层次聚类分析中的应用因此本实验选择先将数据进行主成分分析降维,再进行层次聚类主成分分析:主成分分析(PCA),主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。本实验主要是利用了pca的数据降维能力数据:本文采用了30位学生的5门课程成绩来作为实验数据。如图

R语言中主成分分析在层次聚类分析中的应用主成分分析法的前提是需要变量具有相关性,因此,我们需要先查看下各个变量的相关程度

R语言中主成分分析在层次聚类分析中的应用运行结果为

R语言中主成分分析在层次聚类分析中的应用纵观整个相关系数矩阵,各个变量之间均存在一定的相关性,可进行后续的主成分分析3.确定主成分个数以及主成分一般地,在计算相关系数矩阵后,通过求出其特征值与特征向量,进而计算方差贡献率与累计方差贡献率,这两步操作均可以由R中的princomp函数一步实现确定主成分准则:特征值大于1或累计方差贡献率大于80%(这个值具体需要根据主成分的个数与保留信息综合考虑确定)代码如下

R语言中主成分分析在层次聚类分析中的应用结果如下

R语言中主成分分析在层次聚类分析中的应用从累计贡献率知,前两个成分的累计贡献率就以及接近90%,故选取前两个成分作为主成分

R语言中主成分分析在层次聚类分析中的应用主成分前六行预览如下层次聚类分析

R语言中主成分分析在层次聚类分析中的应用将所选的前两列主成分转入空数据框中为后续运算做准备,并计算两列主成分的欧氏距离,使用这些距离数据进行层次聚类

R语言中主成分分析在层次聚类分析中的应用聚类效果如图:我们发现分为两类时效果最好

R语言中主成分分析在层次聚类分析中的应用用红框标起来更为清晰

-14THANKS感谢恩师

文档评论(0)

周做做的文档合集 + 关注
实名认证
文档贡献者

很高兴来这里认识你们

1亿VIP精品文档

相关文档