聚类分析sas幻灯片.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析sas程序 系统聚类的基本格式 PROC CLUSTER METHOD=聚类方法 选项; Var 变量名列表; ID 变量名; Copy 变量名列表; By 变量名; Run; 指定的聚类方法有method=averave类平均 Centroid重心法, complete最长距离法, Single最短距离法, ward离差平方和法 Flexible可变类平均法 Median中间距离法 EML最大似然谱系法 系统聚类 选项 1 数据集选项 输入数据集 data=sas数据集,默认最近生成的数据集 输出数据集 outtree=sas数据集,生成用于画聚类树的数据集 2 控制聚类之前的数据处理 变量标准化 standard 3 控制聚类过程信息的打印 noid 禁止聚类过程中每次产生合并时打印id值 Print=n 打印聚类过程的最后n层 例 print=3 要求sas打印从3个类到所有样品合并为1个类时的聚类过程,默认打印全过程 Simple 打印每个变量的描述统计量 语句 By语句 对by变量定义的组分别做聚类分析 Id语句 指定标示观测的变量,用于区分聚类历史中打印输出集ottree指定的数据集中的观测,若省略,则用obn表示,n为观测的序号 Copy语句 把语句中指定的变量从输入数据集复制到outtree指定的输出数据集中 Var语句 指出参与聚类分析的变量,默认所有数值变量参与分析 * * P127. 例1. 表4.1 8个样品2个指标的观测值为: i 1 2 3 4 5 6 7 8 xi1 2 2 4 4 -4 -2 -3 -1 xi2 5 3 4 3 3 2 2 -3 例中两个指标的量纲相同,可以不作标准化变换 x1 x2 1 2 3 4 5 76 8 * * data cluster07;input x1 x2 @@; cards; 2 5 2 3 4 4 4 3 -4 3 -2 2 -3 2 -1 -3 ; proc cluster noeigen/*不计算特征值*/ rsquare out=tre method=single; var x1 x2; proc tree;run; * * Single Linkage Cluster Analysis Root-Mean-Square Total-Sample Standard Deviation=2.795085 Mean Distance Between Observations= 5.035943 Number Frequency Normalized of of New emipartial Minimum Clus Clus Joi Cluster R-Squared R-Squared Distance Tie ters ters ned 7 OB3 OB4 2 0.004571 0.995429 0.198573 T 6 OB6 OB7 2 0.004571 0.990857 0.198573 5 OB5 CL6 3 0.019810 0.971048 0.280824 4 OB1 OB2 2 0.018286 0.952762 0.397145 T 3 CL4 CL7 4 0.038857 0.913905 0.397145 2 CL3 CL5 7 0.595701 0.318204 0.818736 1 CL2 OB8 8 0.318204 0.000000 1.012525 * * Root-Mean-Square Total-Sample Standard Deviation=2.795085 Mean Distance Between Observations= 5.035943 * * Number Frequency Normalized of of New semi-partial Minimum Clus Clus Joi Cluster R-Squared R-Squared Distance Tie ters ters ned 7 OB3 OB4 2 0.004571 0.995429 0.198573 T 6 OB6 OB7 2

文档评论(0)

mwk365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档