判别分析和聚类分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第9讲 判别分析和聚类分析 医学统计学 (Medical Statistics) 西南交通大学峨眉校区基础课部数学教研室 一、判别分析 二、聚类分析 本讲结构 一、判别分析 回归分析,判别分析,聚类分析被称为多元统计的三大方法. 判别分析(discriminant analysis)是根据要判别对象的若干个指标的观测结果判断其应属于已知类中的哪一类的统计学方法. 经典的判别分析方法有:Fisher判别和Bayes判别,原理都是建立判别函数使得错判率达到最小. 判别分析方法SPSS实现步骤 1. 选择classify→discriminant; 2. 选择分类变量(Grouping Variable),定义分类范围数(1~n); 3. 选择分类指标变量(Independents); 4. 设置统计量Statistics中的Fisher系数,Classify中的判别符合率表Summary table; 例:判别分析.sav 5. 由Fisher判别函数计算要判别的对象, 哪个判别函数计算的值最大,该判别对象就属于哪一类. 二、聚类分析 聚类分析(Cluster Analysis)是按”物以类聚”的原则将特性相近的对象进行归类. SPSS中的聚类分析按数据的排列位置分为变量聚类(Variables)和样品(Cases)聚类两类. SPSS中的聚类分析按方法分为三种: 两步聚类(TwoStep Cluster) K类中心聚类(K-Means Cluster) 系统聚类(Hierarchical Cluster) 系统聚类(Hierarchical Cluster)的基本思想 (1)相近的聚为一类(以距离表示); (2)相似的聚为一类(以相似系数表示); 最短距离法(single linkage) 最长距离法(complete linkage) 中间距离法(median method) 可变距离法(flexible median) 重心法(centroid) 类平均法(average) 可变类平均法(flexible average) Ward最小方差法(Ward’s minimum variance) 构造n个类,每个类包含且只包含一个样品。 计算n个样品两两间的距离,构成距离矩阵,记作D0; 合并距离最近的两类为一新类; 计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3); 画聚类图; 决定类的个数,及各类包含的样品数,并对类作出解释。 系统聚类的基本步骤 聚类(cluster) 分成几类? 每个样品属于哪一类? 判别(discriminate) 已知分成几类; 根据训练样品建立判别函数; 根据判别函数对待判样品进行归类. 聚类与判别的区别 例:聚类分析.sav 对11项血常规和生化指标进行聚类. 选择聚类方式 Cluster→Variables; 选择要聚类的11个变量; 设置其他需要的选项(可以采用默认值); 聚类结果(冰状聚类图): 说明:空白处的叉起连接作用, 那些是一类是一目了然

文档评论(0)

企业资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档