- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验报告八 SAS聚类分析与判别分析
实验报告八-sas聚类分析与判别分析
实验报告
实验项目名称所属课程名称实验类型实验日期班级学号姓名成绩
聚类分析和判别分析统计分析和SAS实施验证性实验2022-12-19数学和应用数学
实验概述:【实验目的及要求】掌握sas中根据样本或变量按照其性质上的亲疏、相似程度进行聚类分析的方法以及判别样品所属类型的判别分析的方法。掌握sas系统中编程实现聚类分析与判别分析的方法。【实验原理】sas软件的操作方法及原理【实验环境】(使用的软件)sas9.3实验内容:【实验方案设计】一.理解聚类分析、判别分析的基本概念;二.掌握系统聚类法的基本思想和步骤;三.掌握判别分析的距离判别法、fisher判别法和bayes判别法;四.利用编程proc过程步实现系统聚类法与判别分析。【实验过程】(实验步骤、记录、数据、分析)【练习8-1】为了更深入了解我国人口文化程度状况,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。分析选用了三个指标变量:大学以上文化程度的人口占全部人口的比例(dxbz),初中文化程度的人口占全部人口的比例(czbz),文盲半文盲人口占全部人口的比例(dxbz),原始数据如表所示。表1990年全国人口普查文化程度人口比例regionnumdxbzczbzwmbzbeijing19.330.558.7tianjing24.6729.388.92hebei30.9624.6915.21shanxi41.3829.2411.3neimeng51.4825.4715.39liaoning62.632.328.81jilin72.1526.3110.49heilongj82.1428.4610.87shanghai96.5331.5911.04jiangsu101.4726.4317.23zhejiang111.1723.7417.46anhui120.8819.9724.43fujian131.2316.8715.63jiangxi140.9918.8416.22shandong150.9825.1816.87henan160.8526.5516.15hubei171.5723.1615.79hunan181.1422.5712.1guangdong191.3423.0410.45guangxi200.7919.1410.61hainan211.2422.5313.97sichuan220.9621.6516.24guizhou230.7814.6524.27yunnan240.8113.8525.44xizang250.573.8544.43shanxi261.6724.3617.62gansu271.116.8527.93qinghai281.4917.7627.7ningxia291.6120.2722.06xinjjiang301.8520.6612.75【解答】①利用proccluster过程步实现聚类分析:libnamelmf\;procclusterdata=lmf.p81standardmethod=wardouttree=lmf.tree1pseudo;vardxbzczbzwmbz;copyregion;run;结果:表8.1wardsminimumvarianceclusteranalysiseigenvaluesofthecorrelationmatrixeigenvaluedifferenceproportioncumulative12.219459561.5886447920.630814770.4810890930.149725680.73980.21030.04990.73980.95011.0000thedatahavebeenstandardizedtomean0andvariance1root-mean-squaretotal-samplestandarddeviation1root-mean-squaredistancebetweenobservations2.44949由表8.1ward离差平方和法得出相关系数的特征值,其中各列数据分别为特征值(eigenvalue)、与相邻特征值之差(difference)、占总方差的百分比(proportion)、占总方差累计百分比(cumulative)。本题数据经过标准化,样本均值(mean)为0,方差(variance)为1。其中样本均方根标准差(root-mean-squaretotal-samplestandarddeviation)为1,样品间均方根距离(root-mean-squaredistancebetweenobservatio
原创力文档


文档评论(0)