- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
20章判别分析2015资料
第二节?? ?最大似然判别法(尤度法) 适用于指标为定性指标的两类判别或多类判别。 例20-2 有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。 表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 表20-3列出了各型阑尾炎出现的体征、症状的频率。注:用样本频率作为总体概率的估计值。 表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 资料:个体分两类或多类,判别指标全部为定性或等级资料。 原理:用独立事件的概率乘法定理得到判别对象归属某类的概率(即:似然函数值=各指标的条件概率之积)。 各条件概率之积 (20-7) 1.判别原理 表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 例如:表中情况的条件概率为: P1=0.57×0.73×0.72×0.95×0.08×0.31×0.22=… P2=0.34×0.33×0.45×0.93×0.39×0.57×0.56=… … 2.判别规则(找最大的似然函数值) 例20-2 有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。 表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 如:某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6℃,白细胞23.7×109/L。 3.最大似然判别法的应用 如某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6℃,白细胞23.7×109/L。 根据表20-3得 ?多 元 统 计 ?多 元 统 计 第二十章 判别分析 (discriminant analysis) 一、问题提出: 一天晚上, 一位妇女抱着一个大约七八岁的孩子闯了进急诊室,她的孩子肚子疼得厉害。一名实习医生对小孩进行了体检、触诊、可以基本确定是阑尾炎,但是究竟患脓性的还是其他类型呢?除了等待化验结果外,他是否能通过别的方法来迅速作出判断? 判别分析 从现有已知类别的样本数据训练出一个判别函数来,以后再有未知类别的数据进入后,就利用建立的函数来判断其类别。 比如在之前那个例子中根据一些体征为阑尾炎的不同类型建立判别函数,就可以在病人入院时快速的判断他是否为危险的化脓性阑尾炎,以便及时手术,避免因耽误病情而穿孔。 判别分析 判别分析通常都要设法建立一个判别函数,利用此函数进行判别。判别函数的一般形式: Y=a1x1+a2x2+...anxn 其中:Y为判别分数(判别值),x1 x2...xn为反映研究对象特征的变量,a1 a2...an为系数,也称为判别系数 为了建立判别函数必须使用一个训练样本。 训练样本 已知实际分类且各指标的观测值也已测得的样本,它对判别函数的建立很重要,因此必须是由金标准确立的分类,如果中间出现一例错误,就会导致判别函数的判别效果大大降低。所以除了样本量足够大,还要注重资料的准确性和原分类的可靠性。 样本量的要求 由于判别分析的目的是建立准确有效的判别函数,它对样本量也有一定的要求。一般而言样本量n 应在所使用自变量个数p的10-20倍以上时,函数才比较稳定;自变量个数p在8-10个之间时,函数的判别效果才可能比较理想。 1.各自变量为连续性或有序分类变量。如果存在无序多分类变量,可以使用哑变量方式纳入。 2.样本来自一个多元正态总体。 3.各组的协方差距阵相等,该条件类似于方差分析中的方差齐性。 4.变量间独立,无共线性。 但是判别分析在违反这些适用条件时显得非常稳健,它们对结果的影响其实不大。 判别分析的适用条件 主要不同点就是,在聚类分析中一般人们事先并不知道或不一定要明确应该分成几类,完全根据数据来确定。 而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别。 与聚类分析的区别 目的:作出以多个判别指标判别个体分类的判别函数式或概率公式。 资料:个体分两类或多类,判别指标全部为数值变量或全部为分类变量。 用途:解释和预报(主要用于计量诊断)。 分类(经典): Fisher判别和Bayes判别。 1.计量资料判别分析。目的是作出以定量指标判别个体属性分类或等级的判别函数。 按资料类型分: 2. 计数资料判别分析。目的是作出以定性或等
您可能关注的文档
最近下载
- 《解析几何》教案--吕林根,许子道.pdf
- 美国加州桥梁抗震caltrans seismic design criteria vlysis.pdf VIP
- 2025云南省临沧市市级单位公开遴选(选调)工作71人笔试参考题库附答案解析.docx VIP
- HSE保障措施优化及实施方案研究.docx VIP
- 2025甘肃省公路交通建设集团武仙公路收费运营人员招聘61人笔试模拟试题及答案解析.docx VIP
- 2025年秋新鲁科版英语四年级上册全册课件.pptx
- 颚式破碎机技术参数.docx VIP
- 2024河南资本集团“方舟”第三批招聘41人笔试参考题库附带答案详解.pdf
- 《时尚配饰设计》课件.ppt VIP
- 高边坡专家论证PPT汇报材料(中建).ppt VIP
文档评论(0)