- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 医学统计学 * 2.在方法上 判别分析:用已知个体类别(训练样本)的指标建立判别方程,对新的个体分类。要求数据服从正态,同时可筛选变量和指出变量重要性。 聚类分析:对未知类别个体,通过m个指标的接近程度(相似系数)做归类。不能筛选变量和指出变量的重要性。 * 医学统计学 * 3.在资料的设计和收集上: 判别分析:要事先已知个体类别或结果(y=1或0),收集 个体的m个指标(x)建立分类模型。 聚类分析:不需要个体的结果(y),只收集与分类有关的m个指标(x)。 * 医学统计学 * 选择题 例:有人测量了100名17岁男孩的8个形态指标:如身高、体重、胸围、大腿围、小腿长等,希望从形态学上了解8个指标的类别,可以用___方法. 统计方法: 1.判别分析 2.聚类(样品) 3.聚类(指标) 4.多元线性回归 5.logistic回归 6.析因分析 * 医学统计学 * 思考题 你认为: 聚类分析与判别分析有何不同? 判别分析与logistics回归有何不同? logistics回归与cox回归、多元线性回归有何不同? * 医学统计学 * 本次教学结束 孟虹 电话: 250-74479(办) 办公地点: 军事医学楼 415房间 谢谢! * 医学统计学 * 讲义表19-3 27名焦炉工的生物标志物检测指标数据(SPSS软件操作) * 医学统计学 * 系统聚类菜单 统计方法菜单 对样品聚类 * 医学统计学 * 表19-3数据 变量的统计描述 应对变量进行标准化,选用z分 * 医学统计学 * SPSS软件系统聚类 plots菜单框 method菜单框 选择欧氏距离和类平均法 标准化 * 医学统计学 * SPSS软件提供聚类方法 Cluster method: Between-groups linkage,类平均法(d2/n) Ward method. 最小方差法 Nearest neighbor,最短距离法(最小相似) Furthest neighbor,最长距离法(最大相似) Median clustering,中间距离法 Centroid clustering, 重心法 * 医学统计学 * 讲义27名焦炉工的生物标志物类平均法聚类图 欧氏距离 * 医学统计学 * 27名焦炉工的生物标志物最小相似系数法聚类图 欧氏距离 * 医学统计学 * 例2 研究目的:通过5指数对13个市进行分类,2005 年江苏省13 个城市社会发展指数 * 医学统计学 * 对13个市进行分类的聚类图 * 医学统计学 * 图1 结果的解释 一类:是无锡、苏州、南京、常州; 属于经济发达苏南, 区域优势明显,社会发展水平较高。 二类:扬州、镇江、南通、泰州的苏中地区, 为经济发展处于一般水平。 三类:徐州、淮安、盐城、连云港、宿迁是一类,社会经济发展低水平城市之列苏北地区。 结论:促进苏南苏中苏北三大区域协调发展。 * 医学统计学 * 例3不同产地黄芪微量元素的聚类分析 * 医学统计学 * 不同产地黄芪的微量元素 * 医学统计学 * 不同产地黄芪微量元素的聚类分析 * 医学统计学 * 系统聚类方法在应用时注意问题 方法和结果: 1) 用不同聚类方法,聚类结果(树状图)不同,一般计算多个方法尝试。 2)结合专业和聚类图得到归类结果。 3)主要用于样品(变量)较少的研究. * 医学统计学 * 第三节 动态样品聚类 (k-means cluster) 也称为快速聚类。 目前应用: 1.用于数量较大的样品聚类. 2.数据挖掘分析 生物信息技术的基因芯片功能研究 * 医学统计学 * 计算步骤 1.事先人为指定分类数(k类). 2.根据数据本身的结构确定k类的原始中心点(mean). 3.采用欧氏距离将样品自动归为距离最近(均数)的类。计算新的中心点(mean). 4.根据新中心点(mean),计算各样品的距离. 5.重复3-4步.达到规定要求结束. * 医学统计学 * 动态样品聚类的原理 选k个凝聚点 初始分类 分类是否合理 最终分类 修改分类 是 否 * 医学统计学 * 动态样品聚类特点 优点: 用于数量较大的样品聚类.
您可能关注的文档
- 《信号与系统课件--第七章有限长单位脉冲响应(FIR)数字滤波器的设计方法》课件.ppt
- 《信号与系统课件--第三章离散傅立叶变换DFT》课件.ppt
- 《信号与线性系统分析课件--§13信号的基本运算》课件.ppt
- 《信息筛选》课件.ppt
- 《信仰与禁忌》课件.ppt
- 《星程酒店》课件.ppt
- 《形势政策》课件.ppt
- 《信阳羊山新区项目定位建议》课件.ppt
- 《形位公差测量方法详解》课件.ppt
- 《兴奋在神经元间的传递-曦仔》课件.ppt
- 2024云南红河州金平县发展集团限公司招聘5人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024内蒙古锡林郭勒盟西乌珠穆沁旗林业和草原局招录生态管护员【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024云南省事业单位联考招录【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024下半年湖北孝感市孝南区部分事业单位招聘79人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024下半年四川绵阳事业单位历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024中铁四局总部部门及直属单位员工公开招聘6人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024中铁建电气化局集团南方工程限公司2024届校园招聘【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024云南中冶建设工程限责任公司招聘10人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024中钢集团高校毕业生招聘575人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024下半年浙江嘉兴南湖区卫生系统招聘事业单位工作人员31人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
文档评论(0)