二阶判别分析新算法及应用-集美大学计算机工程学院.DOCVIP

下载本文档

0
0
约7.02千字
约 5页
2017-08-15 发布于天津
举报
版权申诉

二阶判别分析新算法及应用-集美大学计算机工程学院.DOC

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

二阶判别分析新算法及应用-集美大学计算机工程学院

二阶判别分析新算法及应用丁跃潮 (集美大学计算机工程学院, 福建, 厦门361021) [摘要] 本文介绍多元数据二阶判别分析新方法的原理、建模流程、应用流程和应用实例。这种判别分析分两个层次进行判别分析，先进行大类分析建模，再建立每个类的次级分类模型，解决了层次分类问题。二阶判别分析反映了大类特点，也突出了次级类型的数量规律，减少了信息损失，符合事物的层次分类归律。这种方法优于直接进行多类判别，在实际应用中取得了良好的效果，解决了重大难题。 [关键词] 判别分析多元数据二阶判别建模 k-均值聚类 On New Arithmetic Method of Two-step Discriminant Analysis and its Application Ding Yuechao (Computer Engneering Institue, Jimei University, Xiamen 361021, China) Abstract: This paper introduces the principle, modeling flow chart, applying flow chart and a practical example of new arithmetic method called Two-step Discriminant Analysis (TDA) which may be used in multivariate data. The analysis is made in two strata: the classes are modeled first, and then, child-classes are modeled for each class. Thus the dendriform classification has got solution. TDA both reflects the characteristic and gives prominence to the child-classes’ numeric speciality, which decreases the loss of information and accords with the dendriform compartmentalization rule of things. TDA exceeds the method of direct multi-class discriminant analysis. In practical application, we have achieved a lot and given important problems approving solutions. Key words: discriminant analysis, multivariate data, two-step discriminant, modeling, k-mean cluster 0引言判别分析是根据多指标来判断个体所属类别的一种多元统计分析方法，其本质是利用多指标进行综合判断。根据变量取舍情况又分为多组判别和逐步判别 [1][2]。目前，在经济、气象、地质、冶金、生物、农业和医学等需要处理多元数据的诸多领域得到广泛应用。笔者在这些领域的应用中，对逐步判别分析方法进行扩充，提出了二阶判别、定向判别和有序判别等新方法，这里引入其中一种新的分析方法——二阶判别，以解决样本按层次分类判别的问题，并为数据挖掘提供新的途径。 1逐步判别分析原理简介对于一个多元数据矩阵，在数据库领域表现为多字段二维表。假设有来自G个母体的n个已知分类样本，每个样本有m个变量，则在数据库中加上样品标识和已知分类，共有m+2个字段、n条记录。每个样本被看着是m维欧氏空间R上的一个点，每个母体都是R中的一个子空间Rg，这些子空间是互相排斥的，组成了R。需要找出一个办法，即找到判别函数，把空间R划分为G个子空间Rg(g=1,2,…,G)。已知的样本有了空间归属和函数，就能对未知归属的样本进行判别，确定其归属，即判别归类或预测。人们总是希望用较少的变量去划分空间R，因为采集数据记录时，字段越少越好，成本越低。这就需要衡量每个变量参与划分G个母体的能力。这就需要用F检验，给出引入变量的F值和剔除变量的F值，作为引入和剔除变量的门限值。在一个母体内样本间的差异应当较小，不同母体的样本差异应当较大。根据Wilks准则，组内离差越小、组间离差越大，越有利于G个母体的分类。通过计算组间离差B和组内离差W，然后进行F检验，就可以确定变量的取舍。逐步引入和剔除，最终得到区分能力较大的变量组合。求得区分能力显著