- 1、本文档共118页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8.2 判别分析 8.2.1 判别分析的基本概念 8.2.2 SAS中作判别分析的过程 8.2.3 分析实例 8.2.1 判别分析的基本概念 1. 距离判别法 距离判别的基本思想是:样品和哪个总体的距离最近,就判断它属于哪个总体。 (1) 两总体情况 设有两个总体G1和G2,若定义样品x到G1和G2的距离分别为d2(x,G1)和d2(x,G2),则距离判别的判别规则是: 即未知所属总体的样品x离哪个总体较近,就判x属于哪个总体。 当总体G1和G2为正态总体,距离选用马氏距离,公式为: 式中,μ1,μ2,?1,?2分别为总体G1和G2的均值和协差阵。 当?1 = ?2 = ?时,可以证明: d2(x,G1) – d2(x,G2) = – 2[x – (μ1+μ2)/2] ?–1 (μ1–μ2) 令 于是判别规则可表示为 称W(x)为判别函数。由于它是x的线性函数,因此又称为线性判别函数。线性判别的应用最为广泛。 如果?1与?2不等,则判别函数W(x)为: W(x) = d2(x,G1) – d2(x,G2) = 即W(x)是x的二次函数。 (2) 多总体情况 设有m个总体:G1,G2,…,Gm(m 2),它们的均值、协差阵分别为μi,?i,(i = 1,2,…,m)。对任意给定的样品x,要判断它来自哪个总体。 多总体按距离最近的准则对x进行判别归类时,首先计算样品x到m个总体的马氏距离di2(x)(i = 1,2,…,m),然后进行比较,把x判归距离最小的那个总体。 即若dh2(x) = min{di2(x) | i = 1,2,…,m},则x ? Gh。 计算马氏距离di2(x)(i = 1,2,…,m)时,类似地可考虑?1 = ?2 = … = ?m或?i不全相等的两种情况,并用样本统计量作为μi和?i的估计. 2. 费歇尔判别(Fisher) 下面以两个总体为例说明费歇尔判别的思想。 设有两个总体G1、G2,其均值分别为?1和?2,协方差阵分别?1和?2,并假定?1 = ?2 = ?,考虑线性组合:y = Lx。通过寻求合适的L向量,使得来自两个总体的数据间的距离较大,而来自同一个总体数据间的差异较小。为此,可以证明,当选L=c?–1(?1–?2),其中c ? 0时,所得的投影即满足要求。从而称c = 1时的线性函数: y = Lx = (?1 – ?2)?–1x 为费歇尔线性判别函数。 其判别规则为: 其中,m为两个总体均值在投影方向上的中点,即 当?1、?2和?未知时,可由总体G1和G2中分别抽出n1和n2个样品,计算相应的样本均值和协方差阵作为?1、?2和?的估计。 3. 贝叶斯判别(Bayes) (1) 贝叶斯判别法 设有m个总体G1,…,Gm,假定它们各自的分布密度分别为f1(x),f2(x),…,fm(x),各自的先验概率(可以根据经验事先给出或估出)分别为q1,q2,…,qm,显然 贝叶斯判别的方法是:当抽取了一个未知总体的样品x,要判断它属于哪个总体,可用著名的贝叶斯公式计算x属于第j个总体的后验概率: 当 时,判断x属于第h个总体。或者计算按先验概率加权的误判平均损失: 然后再比较这m个误判平均损失的h1(x),h2(x),…,hm(x)的大小,选取其中最小的,就可以判定样品x来自该总体。 上式中C(j | i)为假定本来属于Gi的样品被判为属于Gj时造成的损失。当然C(i | i) = 0,C(j | i)? 0(i,j = 1,…,m)。 在实际问题中,错判的损失可以给出定性的分析,但很难用数值来表示,但应用贝叶斯判别的方法时,要求定量给出C(j | i),C(j | i)的赋值常用以下两种方法: ● 根据经验人为赋值; ● 假定各种错判的损失都相等。 (2) 错判概率 当样品x?Gi,用判别法D判别时,把x判归Gj (i≠j),出现错判。用P(j|I;D)(或简记为P(j|i))表示实属Gi的样品错判为Gj的概率,错判概率的估计方法有下面几种: ● 利用训练样本作为检验集,即用判别方法对已知样品进行回判,统计错判的个数以及错判的比率,作为错判率的估计。此法得出的估计一般较低。 ● 当训练样本的大小足够大时,可留出一些已知类别的样品不参加建立判别准则,而是作为检验集,并把错判的比率作为错判率的估计。此法当检验集较小时估计的方差大。 ● 设一法(或称为交叉确认法),每次留出一个已知类别的
您可能关注的文档
- 华南师范大学·为明·课制评分标准.doc
- 华沁家园5#、6#楼施工组织设计—安全生产管理.doc
- 华铭装饰VI计划书.doc
- 吉林某药业公司西洋参深加工项目环境影响报告书.doc
- 坚持循证医学原则,规范诊治非ST段抬高的急性冠状动脉综合征.doc
- 基于DAC0832和AT89S52的信号发生器设计.doc
- 基于FTA轨道交通运营安全事故分析.doc
- 基于EMD的风力发电机状态监测系统研究.doc
- 基于PCA的传感器网络的故障诊断分析.doc
- 基于人工神经网络ANN和邻近支撑向量机(PSVM)的直齿圆锥齿轮箱故障诊断.docx
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
最近下载
- VAV-空调系统运行中的问题分析和改造的研究.pdf VIP
- 液冷盲插快接头发展研究报告 2025.pdf
- 《高速公路基础设施数字化建设数据标准》.pdf VIP
- DB21T 1388-2005 风沙半干旱地区花生节水高产优质栽培技术规程.pdf VIP
- 九江卫生系统招聘2022年考试真题及答案解析六1.docx VIP
- 九江2022年卫生系统招聘考试真题及答案解析一_1.docx VIP
- 2025年榆林能源集团有限公司招聘工作人员笔试真题及答案.docx VIP
- GB_T 18879-2020 滑道通用技术条件.docx VIP
- 鼻出血急救与护理.pptx
- 《医疗机构消防安全管理九项规定》考核试题.pdf VIP
文档评论(0)