一种新的聚类判别分析框架及其实证研究.docVIP

  • 3
  • 0
  • 约1.27万字
  • 约 18页
  • 2022-03-28 发布于广东
  • 举报

一种新的聚类判别分析框架及其实证研究.doc

一种新的聚类判别分析框架及其实证研究 文档信息 主题: 关于“金融或证券”中“期货”的参考范文。 属性: Doc-02ANA9,doc格式,正文10496字。质优实惠,欢迎下载! 说明: 作为计算机资料、计算机应用资料的写作参考资料,提供解决怎么写及格式等相关问题。 适用: 作为文章写作的参考文献,解决如何写好实用应用文、正确编写文案格式、内容摘取等相关工作。 目录 TOC \o 1-9 \h \z \u 目录 1 正文 1 文1:一种新的聚类判别分析框架及其实证研究 2 1动态聚类判别分析算法的设计和实现 6 1.1新的聚类判别分析框架 6 1.2两总体动态聚类分析算法的设计和实现 8 2关于该算法的实证研究 9 2.1不平衡样本个数的无指导动态聚类 9 2.2平衡样本个数的无指导动态聚类 10 2.3平衡样本个数的有指导动态聚类 11 3结束语 11 文2:一种新的激励形式 11 一、人脉 11 二、人脉激励 13 三、实施人脉激励的几点建议 14 四、结束语 15 参考文摘引言: 16 原创性声明(模板) 17 文章致谢(模板) 17 正文 一种新的聚类判别分析框架及其实证研究 文1:一种新的聚类判别分析框架及其实证研究 0引言 经典聚类分析算法是基于距离计算的。然而除马氏距离定义外,其他距离定义都存在样本指标的量纲处理问题;除马氏距离和斜交空间距离定义外,其他距离定义都存在样本指标的相关性处理问题;另外,包括马氏距离在内的所有距离定义都存在将用于聚类的指标同等对待的缺点,不能反映不同指标对聚类结果的贡献程度。 一般情况下,在确定样本间距离计算方法的基础上,用不同的聚类分析方法得到聚类的结果是不会完全一致的。这是因为在实际应用中,许多对象在不同类之间本身并无清晰的划分。这导致了在既定用于聚类的指标组合的情况下,用不同的聚类方法对同一组样本进行分析会得到不同的聚类结果。如上所述,即使使用同一种聚类方法,有时由于样本的排列顺序不同,也可能导致不同的分类结果。这就提出了对不同的聚类方法进行评价的问题。关于所用方法好坏的评价,现在还没有一个合适的标准。edwards 和cavall isforza (1965) 曾建议把样本分成两类,使得两类间的离差平方和最大[1]。.fisher walter也指出,应该寻找使类内差异最小的聚类方法[2]。因此,评价不同聚类方法的一个重要方面,就是看这些方法得到的聚类结果在类内的接近程度和在类间的相隔程度。一个较好的分类方法应该得到类内差异较小、类间差异较大的聚类结果。在实际应用中,一般采用以下两种处理方法:a)根据分类问题本身的专业知识,结合实际需要来选择分类的方法,并确定分类的个数;b)用多种方法对数据进行分析处理,把结果的共性取出来。如果用几种方法的某些结果都一样,则说明这样的聚类确实反映了事物的本质。将有争议的样本暂放一边,或者用其他方法如判别分析进行处理归类。另外,在聚类分析方法既定的情况下,同一组样本采用不同的指标组合进行聚类分析,通常也会得到不同的分类结果。产生不同结果的原因主要是由于不同的指标组合测度是样本间的不同侧面的相似程度,在进行聚类分析时存在指标组合选择的问题。一般是根据聚类的实际需要进行指标的选择,这是一个比较复杂并且带有主观性的问题。实践中,在开始进行聚类分析时,通常是先选择多种指标组合分别进行聚类,然后对聚类分析的结果进行对比分析,以确定出合适的测度指标。 判别分析产生于20世纪30年代,是利用已知类别的样本建立判别模型,为未知类别的样本判别的一种统计方法。近年来,判别分析在自然科学、社会学及经济管理学科中都有广泛的应用。判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。判别分析按照判别的组数来区分,可以分为两组判别分析和多组判别分析。本文仅研究两组判别分析。在众多的判别分析方法中,最直观的是距离判别法。 距离判别的思想是计算待判样本到第i类总体的平均数的距离。哪个距离最小就将它判归到哪个总体。所以,距离判别法的任务就是构造一个恰当的距离函数,通过样本与某类别之间距离的大小判别其所属类别。这里仅讨论两个总体的距离判别法。距离判别只要求知道总体的数字特征,不涉及总体的分布函数。当参数未知和协方差时,就用样本的均值和协方差矩阵来估计。 从距离判别法可以看到判别规则是一个线性函数。由于线性判别函数使用简便,希望能在更一般的情况下建立一种线性判别函数。fisher判别法由fisher在1936年提出,是根

文档评论(0)

1亿VIP精品文档

相关文档