误差分析课件数据判别分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
误判率回代估计法 设G1和G2为两个总体,容量分别为n1、n2,以全体训练样本作为n1+n2个新样品,逐个代入已建立的判别准则中判别其归属。 第二十九页,共五十二页,2022年,8月28日 误判率回代估计法 其中n12是将属于G1的样品误判为属于G2的个数,n21是将属于G2的样品误判为属于G1的个数,总的误判个数是n12+n21,而总体n1+n2,误判率回代估计为 第三十页,共五十二页,2022年,8月28日 误判率的交叉确认估计法 误判率的交叉估计确认估计是每次剔除训练样本中的一个样品,利用其余容量为n1+n2-1的训练样本建立相应的判别准则,再用所建立的判别准则对剔除的那个样品作判别。对训练样本中的每个样品作上述分析,以其误判的比例作为误判概率的估计。 第三十一页,共五十二页,2022年,8月28日 误判率的交叉确认估计法-步骤 从总体G1的容量为n1的训练样本开始,依次剔除其中一个样品,用剩余的容量为n1-1的训练样本和总体G2的容量为n2的训练样本建立相应的判别函数。 用建立的判别函数对剔除的那个样品作判别 重复以上步骤,直到G1的训练样本中的n1的样品依次被剔除,记录其误判的样品个数 对G2重复以上步骤,确定误判率。 第三十二页,共五十二页,2022年,8月28日 两种误判率确认方法的比较 误判率的交叉确认估计法,所得到的估计称为误判率的交叉确认估计,此方法较回代法更合理,但计算量较大。 误判率的回代估计法作出的误判率是建立判别函数的数据反过来用作评价准则的数据得到,因此由此得出的估计往往比真实误判率小,当训练样本较大的时候,此法可以作为真实误判率的一种近似估计。 第三十三页,共五十二页,2022年,8月28日 其他分类判别准则 基于概率统计的贝叶斯分类准则 判别函数分类设计(线性、非线性、支持向量机……) 神经网络分类 决策树分类 粗糙集分类 第三十四页,共五十二页,2022年,8月28日 数据判别分析 第二部分 实例分析 ——距离判别分析法在岩体质量等级分类中的应用 主讲人:吴佳欢 第三十五页,共五十二页,2022年,8月28日 数据判别实例分析 ——距离判别分析法在岩体质量等级分类中的应用 研究意义 工程岩体质量反映了岩体结构固有的物理力学特性,为工程稳定分析、岩体的合理利用以及正确选择各类岩体力学参数等提供了可靠的依据。 第三十六页,共五十二页,2022年,8月28日 数据判别实例分析 ——距离判别分析法在岩体质量等级分类中的应用 对象特征 在岩石力学与工程系统中,许多情况下由于系统具有 1.复杂性 2.模糊性 3.高度非线性 数据分布形式和变量之间的关系是难以准确获知的 第三十七页,共五十二页,2022年,8月28日 第一页,共五十二页,2022年,8月28日 判别分析概念及应用 概念 应用 第二页,共五十二页,2022年,8月28日 判别分析概念 在自然科学与社会科学等众多领域中,研究对象往往用某种方式已划分为若干类型,当得到一个新的样品,要确定该样品属于已知类型的哪一类,这类问题就属于判别分析. 第三页,共五十二页,2022年,8月28日 判别分析的应用 在工业生产中判断产品的等级; 在经济发展中判断一个国家经济发展程度; 医学中根据化验结果判断病人的疾病类型等. 第四页,共五十二页,2022年,8月28日 相似性测度 判断样品之间的相似性常采用近邻准则,就是把待分类样品与标准模版进行比较,看和哪个模版匹配程度更好,从而确定待测样品的分类。 计算模式相似性测度有欧式距离、马氏距离、夹角余弦距离、Tanimoto测度等多种距离算法。 第五页,共五十二页,2022年,8月28日 近邻准测分类的两种计算方法 1 通过与样品库所有样品特征分别作相似性测度,找出最接近的样品,取该样品所属类别作为待测样品的类别。 2 待测样品与样品库中不同类别的中心或重心作相似性测度,找出最接近类的中心,以该类作为待测样品的类别。 第六页,共五十二页,2022年,8月28日 距离算法 样品与样品之间的距离 样品与类之间的距离 类内距离 类与类之间的距离 第七页,共五十二页,2022年,8月28日 样品间距离示意图 同类内样品间的距离 不同类内样品间的距离 第八页,共五十二页,2022年,8月28日 样品与样品之间的距离 A: B: 第九页,共五十二页,2022年,8月28日 样品间的距离计算公式 第十页,共五十二页,2022年,8月28日 样品与类之间的距离 W为代表某类样品的集合,其中有n个样品,x为待测样品。 第十一页,共五十二页,2022年,8月28日 样品与类的距离的计算方法 1 计算待测样品和类中每个样品之间的距离后求平均值。 2 计算类的中心点,

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档