聚类分析——医学统计课件PPT.pptVIP

下载本文档

3
0
约4.12千字
约 67页
2018-01-25 发布于江苏
举报
版权申诉

聚类分析——医学统计课件PPT.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

聚类分析——医学统计课件PPT

讲义表19-3 27名焦炉工的生物标志物检测指标数据(SPSS软件操作) 系统聚类菜单统计方法菜单对样品聚类表19-3数据变量的统计描述应对变量进行标准化,选用z分 SPSS软件系统聚类 plots菜单框 method菜单框选择欧氏距离和类平均法标准化 SPSS软件提供聚类方法 Cluster method： Between-groups linkage,类平均法(d2/n） Ward method. 最小方差法 Nearest neighbor,最短距离法（最小相似） Furthest neighbor,最长距离法（最大相似） Median clustering,中间距离法 Centroid clustering, 重心法讲义27名焦炉工的生物标志物类平均法聚类图欧氏距离 27名焦炉工的生物标志物最小相似系数法聚类图欧氏距离例2 研究目的：通过5指数对13个市进行分类，2005 年江苏省13 个城市社会发展指数对13个市进行分类的聚类图图1 结果的解释一类:是无锡、苏州、南京、常州; 属于经济发达苏南, 区域优势明显,社会发展水平较高。二类：扬州、镇江、南通、泰州的苏中地区, 为经济发展处于一般水平。三类：徐州、淮安、盐城、连云港、宿迁是一类,社会经济发展低水平城市之列苏北地区。结论：促进苏南苏中苏北三大区域协调发展。例3不同产地黄芪微量元素的聚类分析不同产地黄芪的微量元素不同产地黄芪微量元素的聚类分析系统聚类方法在应用时注意问题方法和结果: 1) 用不同聚类方法,聚类结果(树状图)不同，一般计算多个方法尝试。 2）结合专业和聚类图得到归类结果。 3)主要用于样品(变量)较少的研究. 第三节动态样品聚类 (k-means cluster) 也称为快速聚类。目前应用: 1.用于数量较大的样品聚类. 2.数据挖掘分析生物信息技术的基因芯片功能研究计算步骤 1.事先人为指定分类数(k类). 2.根据数据本身的结构确定k类的原始中心点(mean). 3.采用欧氏距离将样品自动归为距离最近(均数)的类。计算新的中心点(mean). 4.根据新中心点(mean),计算各样品的距离. 5.重复3-4步.达到规定要求结束. 动态样品聚类的原理选k个凝聚点初始分类分类是否合理最终分类修改分类是否聚类分析（Cluster Analysis）古语: “物以类聚”，找出特征相似的类别，研究其规律性。第二军医大学卫生统计学教研室孟虹本章的内容第一节相似系数* 第二节系统聚类* 第三节动态样品聚类* 第四节有序样品聚类第五节应用注意事项* 重点:掌握聚类分析用途、概念、方法的区别、注意问题。概述聚类分析是将未知现象进行归类的多元统计方法。主要用途: 对研究的事物分类或做探索性的研究。目的: 通过分类,找出同类的共性和不同类的差异,为决策提供参考. 聚类分析聚类对象的类型： R型聚类：对n个指标（变量或variable ）归类(index-cluster-analysis)。 Q型聚类：对n个观察对象（样品或case）归类(samples-cluster-analysis)。例:中医证型研究对临床症状分类(指标聚类) 聚类分析基本思想与步骤思想: 根据指标和样品的相似性. 步骤: 1.计算描述样品(变量)间相似性的指标：用距离系数或相关系数. 2.根据相似性对样品(变量)归类. 方法:有多种聚类方法第一节相似系数意义:用相似系数度量指标和样品间的相似程度. 1.指标(变量)间的相似系数: ①变量为计量数据相关系数(r) (19-1) ②变量为计数数据(等级或两分类) 列连系数(C)