- 2
- 0
- 约6.54千字
- 约 52页
- 2021-11-03 发布于广东
- 举报
2021/6/30 2021/6/30 执行K-Means Cluster命令,使用K均值分类法对观测量进行聚类。可以完全使用系统的默认值来执行该命令,也可以对聚类通过设置各种参数进行聚类。 进行快速样本聚类首先要选择用于聚类分析的变量和类数。参与聚类分析的变量必须是数值型变量,且至少有一个。 为了清楚的表明各观测量最后聚到哪一类,还应该指定一个表明观测量特征的变量作为表示变量。 2021/6/30 快速聚类分析SPSS过程 首先需要用户指定聚类成多少类(比如K类)。 然后SPSS根据样本数据的实际情况,选择K个有代表性的样本数据作为初始类中心。初始类中心也可以由用户自行指定,需要指定K组样本数据作为初始类中心点。 计算所有样本数据点到K个类中心点的欧氏距离,SPSS按照距K个类中心点距离最短原则,把所有样本分派到各中心点所在的类中,形成一个新的K类,完成一次迭代过程。 2021/6/30 SPSS重新确定k个类的中心点。SPSS计算每个类中各个变量的变量值均值,并以均值点作为新的类中心点。 重复上面的两步计算过程,直到达到指定的达代次数或终止迭代的判断要求为止。 2021/6/30 月份 月平均增长率(%) 身高(cm) 体重(kg) 胸围(cm) 坐高(cm) 1 2 3 4 6 8 10 12 15 18 24 30 36 42 48 54 60 66 72 11.03 5.47 3.58 2.01 2.13 2.06 1.63 1.17 1.03 0.69 0.77 0.59 0.65 0.51 0.73 0.53 0.36 0.52 0.34 50.30 19.30 9.85 4.17 5.65 1.74 2.04 1.60 2.34 1.33 1.41 1.25 1.19 0.93 1.13 0.82 0.52 1.03 0.49 11.81 5.20 3.14 1.47 1.04 0.17 1.04 0.98 0.53 0.48 0.52 0.30 0.49 0.16 0.35 0.16 0.19 0.30 0.18 11.27 7.18 2.11 1.58 2.11 1.57 1.46 0.76 0.89 0.58 0.42 0.14 0.38 0.25 0.55 0.34 0.21 0.55 0.16 如:为研究儿童生长发育的分期,调查1253名一个月至7岁儿童的身高、体重、胸围和坐高的资料,先把一个月至7岁儿童划成19个月份段,分月份段算出各指标的平均值,将第1个月份段的各指标的平均值与出生时的各指标平均值比较,求出月平均增长率,然后,第2个月份段起的各月份段指标平均值均与前一月份段比较,亦求出月平均增长率,结果如下表: 欲将儿童生长发育分为四期,故指定聚类的类别数为4,试通过聚类分析确定四个儿童生长发育期的起止区间。 2021/6/30 点击Analyze项,展开下拉菜单,选择Classify中的K-Means Cluster项,进入K-Means Cluster Analysis对话框。 2021/6/30 Variables:分析变量栏。 Label Cases by:标识变量栏。 Number of Cluster:确定聚类数栏,系统默认值为2。 Method:聚类方法栏。 Iterate and classify:指先定初始类别中心点,而后按K-Means算法作迭代分类; Classify only:仅按初始类别中心点分类。 2021/6/30 Read initial 选项:选中表示从某个SPSS数据文件中读入初始类中心点。这个SPSS文件需要事先创建并存储在计算机中。其中:各变量的变量名应与当前SPSS数据编辑窗口中的变量名完全吻合;需要指定K个样本的数据,分别对应K个类的初始中心点。 Write final 选项:选中表示将快速聚类分析的最终类中心点写入某个SPSS数据文件中,通过单击其后的File按钮进行指定。 2021/6/30 用于确定快速聚类分析的迭代终止条件: Maximum Iterations框:指定最大的迭代次数,迭代达到该次数时终止聚类分析过程。 Convergence Criterion:为迭代的距离收敛标准。当新一次迭代形成的若干个类中心点和上一次的类中心点间的最大距离小于指定数据时,终止聚类分析过程。 Use running means:表示每当一个样本分配到一类后重新计算新的类中心点,快速距离分析的类中心点将与样本进入的先后顺序有关;不选中该项,则完成所有样本依次类分配后计算各类中心点,这种方式可以节省运算时间,尤其是样本容量较大的时候。 2021/6/30 Cluster membership复选框,
您可能关注的文档
- 《样本与统计量》PPT课件.ppt
- 《养生杂谈-茶文化》PPT课件.ppt
- 有机化学复习策略廖传珠PPT精品文档.ppt
- 《杨修之死》PPT课件.ppt
- 平角和周角PPT精品文档.ppt
- 《阳光心态的培养》PPT课件.ppt
- 植物变形PPT精品文档.ppt
- 周大福案例分析PPT精品文档.ppt
- 《演示文稿老王》PPT课件.ppt
- 中国之声PPT精品文档.ppt
- 光伏发电工程电气监理实施细则.pdf
- 2025年信息安全体系考核卷最新版.pdf
- 2025年项目招标投标管理与实施指南.pdf
- 2025-2026学年广东省深圳八年级(上)英语期中考试真题(三)(学生版).pdf
- 2025年经济专业考试题库及答案.pdf
- 2025年版事业单位工勤技能-福建-福建政务服务办事员三级(高级工)历年参考题库含答案详解3套试卷.pdf
- 2025年大模型训练师模拟练习卷.pdf
- 2025年劳动合同解除通知范文下载附4篇.pdf
- 2025年供应链管理师职业能力等级认证考试(中级)历年参考题库含答案详解(5套卷).pdf
- 2024-2025年度医疗机构信息化建设标准.pdf
最近下载
- 人教版九年级数学下册2026年春季学期教学工作计划与教学进度表 (最新教材).docx
- T_CACM 1649—2025(支气管扩张症中西医结合诊疗指南).pdf
- 第六届福建省综合气象业务职业技能竞赛【决赛】理论考试题库-上(单选题部分).docx VIP
- 标准图集-07MS101 市政给水管道工程及附属设施.pdf VIP
- 2024年国网四川省电力公司招聘考试真题.pdf VIP
- 【2026年春新教材】部编版小学二年级下册道德与法治全册教案(教学设计).pdf
- 数学思政课教学案例.docx VIP
- 2024-2025学年广东省东莞市东华高级中学、东华松山湖高级中学高一下学期学习效率检测(一)数学试卷(含答案).docx VIP
- (高清版)DB12∕T 1115-2021 泵站工程运行管理规程.pdf VIP
- DB3305_T276-2023_生态联勤警务站建设与管理规范_湖州市 .docx VIP
原创力文档

文档评论(0)