- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析——医学统计课件PPT
讲义表19-3 27名焦炉工的生物标志物检测指标数据(SPSS软件操作) 系统聚类菜单 统计方法菜单 对样品聚类 表19-3数据 变量的统计描述 应对变量进行标准化,选用z分 SPSS软件系统聚类 plots菜单框 method菜单框 选择欧氏距离和类平均法 标准化 SPSS软件提供聚类方法 Cluster method: Between-groups linkage,类平均法(d2/n) Ward method. 最小方差法 Nearest neighbor,最短距离法(最小相似) Furthest neighbor,最长距离法(最大相似) Median clustering,中间距离法 Centroid clustering, 重心法 讲义27名焦炉工的生物标志物类平均法聚类图 欧氏距离 27名焦炉工的生物标志物最小相似系数法聚类图 欧氏距离 例2 研究目的:通过5指数对13个市进行分类,2005 年江苏省13 个城市社会发展指数 对13个市进行分类的聚类图 图1 结果的解释 一类:是无锡、苏州、南京、常州; 属于经济发达苏南, 区域优势明显,社会发展水平较高。 二类:扬州、镇江、南通、泰州的苏中地区, 为经济发展处于一般水平。 三类:徐州、淮安、盐城、连云港、宿迁是一类,社会经济发展低水平城市之列苏北地区。 结论:促进苏南苏中苏北三大区域协调发展。 例3不同产地黄芪微量元素的聚类分析 不同产地黄芪的微量元素 不同产地黄芪微量元素的聚类分析 系统聚类方法在应用时注意问题 方法和结果: 1) 用不同聚类方法,聚类结果(树状图)不同,一般计算多个方法尝试。 2)结合专业和聚类图得到归类结果。 3)主要用于样品(变量)较少的研究. 第三节 动态样品聚类 (k-means cluster) 也称为快速聚类。 目前应用: 1.用于数量较大的样品聚类. 2.数据挖掘分析 生物信息技术的基因芯片功能研究 计算步骤 1.事先人为指定分类数(k类). 2.根据数据本身的结构确定k类的原始中心点(mean). 3.采用欧氏距离将样品自动归为距离最近(均数)的类。计算新的中心点(mean). 4.根据新中心点(mean),计算各样品的距离. 5.重复3-4步.达到规定要求结束. 动态样品聚类的原理 选k个凝聚点 初始分类 分类是否合理 最终分类 修改分类 是 否 聚类分析 (Cluster Analysis) 古语: “物以类聚”,找出特征相似的类别,研究其规律性。 第二军医大学卫生统计学教研室 孟 虹 本章的内容 第一节 相似系数* 第二节 系统聚类* 第三节 动态样品聚类* 第四节 有序样品聚类 第五节 应用注意事项* 重点:掌握聚类分析用途、概念、方法的区别、注意问题。 概 述 聚类分析是将未知现象进行归类的多元统计方法 。 主要用途: 对研究的事物分类或做探索性的研究。 目的: 通过分类,找出同类的共性和不同类的差异,为决策提供参考. 聚类分析 聚类对象的类型: R型聚类:对n个指标(变量或variable )归类(index-cluster-analysis)。 Q型聚类:对n个观察对象(样品或case)归类(samples-cluster-analysis)。 例:中医证型研究 对临床症状分类(指标聚类) 聚类分析基本思想与步骤 思想: 根据指标和样品的相似性. 步骤: 1.计算描述样品(变量)间相似性的指标:用距离系数或相关系数. 2.根据相似性对样品(变量)归类. 方法:有多种聚类方法 第一节 相似系数 意义:用相似系数度量指标和样品间的相似程度. 1.指标(变量)间的相似系数: ①变量为计量数据 相关系数(r) (19-1) ②变量为计数数据(等级或两分类) 列连系数(C)
文档评论(0)