《医学统计学课件--聚类分析-07》课件.ppt

《医学统计学课件--聚类分析-07》课件.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 医学统计学 * 2.在方法上 判别分析:用已知个体类别(训练样本)的指标建立判别方程,对新的个体分类。要求数据服从正态,同时可筛选变量和指出变量重要性。 聚类分析:对未知类别个体,通过m个指标的接近程度(相似系数)做归类。不能筛选变量和指出变量的重要性。 * 医学统计学 * 3.在资料的设计和收集上: 判别分析:要事先已知个体类别或结果(y=1或0),收集 个体的m个指标(x)建立分类模型。 聚类分析:不需要个体的结果(y),只收集与分类有关的m个指标(x)。 * 医学统计学 * 选择题 例:有人测量了100名17岁男孩的8个形态指标:如身高、体重、胸围、大腿围、小腿长等,希望从形态学上了解8个指标的类别,可以用___方法. 统计方法: 1.判别分析 2.聚类(样品) 3.聚类(指标) 4.多元线性回归 5.logistic回归 6.析因分析 * 医学统计学 * 思考题 你认为: 聚类分析与判别分析有何不同? 判别分析与logistics回归有何不同? logistics回归与cox回归、多元线性回归有何不同? * 医学统计学 * 本次教学结束 孟虹 电话: 250-74479(办) 办公地点: 军事医学楼 415房间 谢谢! * 医学统计学 * 讲义表19-3 27名焦炉工的生物标志物检测指标数据(SPSS软件操作) * 医学统计学 * 系统聚类菜单 统计方法菜单 对样品聚类 * 医学统计学 * 表19-3数据 变量的统计描述 应对变量进行标准化,选用z分 * 医学统计学 * SPSS软件系统聚类 plots菜单框 method菜单框 选择欧氏距离和类平均法 标准化 * 医学统计学 * SPSS软件提供聚类方法 Cluster method: Between-groups linkage,类平均法(d2/n) Ward method. 最小方差法 Nearest neighbor,最短距离法(最小相似) Furthest neighbor,最长距离法(最大相似) Median clustering,中间距离法 Centroid clustering, 重心法 * 医学统计学 * 讲义27名焦炉工的生物标志物类平均法聚类图 欧氏距离 * 医学统计学 * 27名焦炉工的生物标志物最小相似系数法聚类图 欧氏距离 * 医学统计学 * 例2 研究目的:通过5指数对13个市进行分类,2005 年江苏省13 个城市社会发展指数 * 医学统计学 * 对13个市进行分类的聚类图 * 医学统计学 * 图1 结果的解释 一类:是无锡、苏州、南京、常州; 属于经济发达苏南, 区域优势明显,社会发展水平较高。 二类:扬州、镇江、南通、泰州的苏中地区, 为经济发展处于一般水平。 三类:徐州、淮安、盐城、连云港、宿迁是一类,社会经济发展低水平城市之列苏北地区。 结论:促进苏南苏中苏北三大区域协调发展。 * 医学统计学 * 例3不同产地黄芪微量元素的聚类分析 * 医学统计学 * 不同产地黄芪的微量元素 * 医学统计学 * 不同产地黄芪微量元素的聚类分析 * 医学统计学 * 系统聚类方法在应用时注意问题 方法和结果: 1) 用不同聚类方法,聚类结果(树状图)不同,一般计算多个方法尝试。 2)结合专业和聚类图得到归类结果。 3)主要用于样品(变量)较少的研究. * 医学统计学 * 第三节 动态样品聚类 (k-means cluster) 也称为快速聚类。 目前应用: 1.用于数量较大的样品聚类. 2.数据挖掘分析 生物信息技术的基因芯片功能研究 * 医学统计学 * 计算步骤 1.事先人为指定分类数(k类). 2.根据数据本身的结构确定k类的原始中心点(mean). 3.采用欧氏距离将样品自动归为距离最近(均数)的类。计算新的中心点(mean). 4.根据新中心点(mean),计算各样品的距离. 5.重复3-4步.达到规定要求结束. * 医学统计学 * 动态样品聚类的原理 选k个凝聚点 初始分类 分类是否合理 最终分类 修改分类 是 否 * 医学统计学 * 动态样品聚类特点 优点: 用于数量较大的样品聚类.

您可能关注的文档

文档评论(0)

秦圈圈 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档