误差分析课件数据判别分析.pptVIP

下载本文档

2
0
约3.48千字
约 52页
2023-06-24 发布于广东
举报
版权申诉

误差分析课件数据判别分析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

误判率回代估计法设G1和G2为两个总体，容量分别为n1、n2，以全体训练样本作为n1＋n2个新样品，逐个代入已建立的判别准则中判别其归属。第二十九页，共五十二页，2022年，8月28日误判率回代估计法其中n12是将属于G1的样品误判为属于G2的个数，n21是将属于G2的样品误判为属于G1的个数，总的误判个数是n12＋n21，而总体n1＋n2，误判率回代估计为第三十页，共五十二页，2022年，8月28日误判率的交叉确认估计法误判率的交叉估计确认估计是每次剔除训练样本中的一个样品，利用其余容量为n1+n2-1的训练样本建立相应的判别准则，再用所建立的判别准则对剔除的那个样品作判别。对训练样本中的每个样品作上述分析，以其误判的比例作为误判概率的估计。第三十一页，共五十二页，2022年，8月28日误判率的交叉确认估计法－步骤从总体G1的容量为n1的训练样本开始，依次剔除其中一个样品，用剩余的容量为n1－1的训练样本和总体G2的容量为n2的训练样本建立相应的判别函数。用建立的判别函数对剔除的那个样品作判别重复以上步骤，直到G1的训练样本中的n1的样品依次被剔除，记录其误判的样品个数对G2重复以上步骤，确定误判率。第三十二页，共五十二页，2022年，8月28日两种误判率确认方法的比较误判率的交叉确认估计法，所得到的估计称为误判率的交叉确认估计，此方法较回代法更合理，但计算量较大。误判率的回代估计法作出的误判率是建立判别函数的数据反过来用作评价准则的数据得到，因此由此得出的估计往往比真实误判率小，当训练样本较大的时候，此法可以作为真实误判率的一种近似估计。第三十三页，共五十二页，2022年，8月28日其他分类判别准则基于概率统计的贝叶斯分类准则判别函数分类设计（线性、非线性、支持向量机……）神经网络分类决策树分类粗糙集分类第三十四页，共五十二页，2022年，8月28日数据判别分析第二部分实例分析 ——距离判别分析法在岩体质量等级分类中的应用主讲人：吴佳欢第三十五页，共五十二页，2022年，8月28日数据判别实例分析 ——距离判别分析法在岩体质量等级分类中的应用研究意义工程岩体质量反映了岩体结构固有的物理力学特性，为工程稳定分析、岩体的合理利用以及正确选择各类岩体力学参数等提供了可靠的依据。第三十六页，共五十二页，2022年，8月28日数据判别实例分析 ——距离判别分析法在岩体质量等级分类中的应用对象特征在岩石力学与工程系统中，许多情况下由于系统具有 1.复杂性 2.模糊性 3.高度非线性数据分布形式和变量之间的关系是难以准确获知的第三十七页，共五十二页，2022年，8月28日第一页，共五十二页，2022年，8月28日判别分析概念及应用概念应用第二页，共五十二页，2022年，8月28日判别分析概念在自然科学与社会科学等众多领域中,研究对象往往用某种方式已划分为若干类型,当得到一个新的样品,要确定该样品属于已知类型的哪一类,这类问题就属于判别分析. 第三页，共五十二页，2022年，8月28日判别分析的应用在工业生产中判断产品的等级; 在经济发展中判断一个国家经济发展程度; 医学中根据化验结果判断病人的疾病类型等. 第四页，共五十二页，2022年，8月28日相似性测度判断样品之间的相似性常采用近邻准则，就是把待分类样品与标准模版进行比较，看和哪个模版匹配程度更好，从而确定待测样品的分类。计算模式相似性测度有欧式距离、马氏距离、夹角余弦距离、Tanimoto测度等多种距离算法。第五页，共五十二页，2022年，8月28日近邻准测分类的两种计算方法 1 通过与样品库所有样品特征分别作相似性测度，找出最接近的样品，取该样品所属类别作为待测样品的类别。 2 待测样品与样品库中不同类别的中心或重心作相似性测度，找出最接近类的中心，以该类作为待测样品的类别。第六页，共五十二页，2022年，8月28日距离算法样品与样品之间的距离样品与类之间的距离类内距离类与类之间的距离第七页，共五十二页，2022年，8月28日样品间距离示意图同类内样品间的距离不同类内样品间的距离第八页，共五十二页，2022年，8月28日样品与样品之间的距离 A: B: 第九页，共五十二页，2022年，8月28日样品间的距离计算公式第十页，共五十二页，2022年，8月28日样品与类之间的距离 W为代表某类样品的集合，其中有n个样品，x为待测样品。第十一页，共五十二页，2022年，8月28日样品与类的距离的计算方法 1 计算待测样品和类中每个样品之间的距离后求平均值。 2 计算类的中心点，