- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卫生统计学 判别分析
二、医学中的分类问题: 1.疾病诊断 第一节 Bayes判别 主要用于定量数据的两类或多类判别. Bayes判别的思想: 基于Bayes准则,假定已知各类出现的先验概率P(Yk),且各类变量近似服从多元正态分布,获得Bayes判别函数。计算各个体出现的后验概率进行判别。 * * 第十六章 观察对象的分类分析方法 ---------判别分析 (Discriminant Analysis) 主要有判别分析和聚类分析 判别分析:事物的分类是清楚的,目的是通过已知分类建立判别函数,预测新的观察对象所属类别。 聚类分析:事物分类不清楚,分几类不清楚,目的希望将事物进行分类(探索性研究)。 事物分类的统计方法: 判别分析(discriminant analysis)是在已知分为哪若干类的前提下,通过现有数据建立判别方程(函数),根据对象若干个指标的观测结果判定其应属于哪一类的多元统计学方法。常用的判别分析的方法有Bayes判别、Fisher判别、非参数判别、最大似然判别等。 当事先并不知道观察对象应分为哪若干类别时,采用聚类分析方法进行分类。 一、判别分析的基本概念 与聚类分析有所不同的是: 判别分析法首先需要对所研究对象进行分类,进一步选择若干对观测对象能够较全面地描述的变量,建立判别函数。对一个未确定类别的个案只要将其代入判别函数就可以判断它属于哪一类总体。 例:用电感耦合等离子体发射光谱法测定肺癌患者和健康人尿液中的铬、铁、锰、铝、镉、铜、锌、镍,用原子荧光光谱法测定硒。对肺癌患者和健康人尿液中9种微量元素进行判别分析,为肺癌的早期诊断提供科学依据。----陈丹丹等.对肺癌患者和健康人尿液中9种微量元素的判别分析.药物分析杂志.2009, 29 (6). 预测病人的预后(好或差),提出早期治疗方法,降低严重后果。 例如根据新生儿出生后1 分钟阿氏评分(X1) 、窒息复苏时间(X2 ) 、惊厥持续天数(X3 ) 、急性期CT 改变(X4) 及治疗3 天后原始反射情况(X5)判别新生儿缺血缺氧性脑病的预后(脑性瘫痪 、严重智能低下、正常)。 2.疾病的预测 用途:通过数据建立判别方程,对研究事物进行分类和预测。 对资料要求: 要求建立方程的观察对象分类(y)已经明确(用金标准确定),收集建模对象(训练样本)的m个变量(x)建立判别方程。 三、判别分析的特点 根据自变量(x)资料性质: 自变量(x)为定量数据: Fisher判别、Bayes判别(SPSS、SAS统计软件可实现)。 自变量(x) 为定性数据: 最大似然判别法、Bayes公式判别(统计软件不能自动实现)。 四、判别分析建模的方法 五、判别分析方法的基本步骤 1.建立判别函数(方程) 2.规定判别(分类)准则 判别新个体为某类 3.评价判别方程的效果 一、分析步骤 1.筛选判别指标 选择其中相互独立的部分指标建立判别函数. 在建立判别函数之前,要先进行逐步判别分析,筛选出主要的判别指标,然后再对主要的判别指标作判别分析 . SAS中的STEPDISC过程用来筛选判别指标,用Wilks’ Lambda统计量及对应P值来衡量. 决定某变量是否入选: 以已进入模型的变量作为协变量,将待考察的某变量作为应变量,以各类别作为对比组,采用协方差分析来判断扣除协变量的影响后,待考察的变量在各类别间有无差别。如果有差别,待考察的变量可进入方程;反之,则不能入选。 协方差分析:将对应变量Y有线性影响但未加控制或难以控制的定量变量X看做协变量,把X化为相等后比较各组Y的修正均数,是线性回归与方差分析结合起来的一种统计分析方法。模型中无任何变量时即为方差分析。 2.建立Bayes判别函数 已知判别对象分为g类,有m个判别指标Xj(j=1,2,…,m),要求各类的m个判别指标均近似服从多元正态分布。当各类的协方差矩阵相等时,计算合并协方差矩阵,表示判别指标Xi、Xj的合并协方差,按公式(16-1)计算。 表示第k类中变量Xi、Xj的均数;nk为第k类的例数 求解 (k=1,2,…,g) 由 计算 为第k类(k=1,2,…, g)出现的先验概率,当不知道各类的先验概率时,一般取等概率1/g,也可取频率 (当样本较大且无选择性偏倚)。 建立线性Bayes判别函数: (j=0,1 2,…,m; k=1,
文档评论(0)