管理决策模型与方法 (聚类分析部分).doc

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
管理决策模型与方法 (聚类分析部分).doc

管理决策模型与方法 (聚类分析部分) (适用于信息管理与信息系统、工商管理专业 30H) 主讲教师:屈春艳 工商管理学院信息管理教研室 第三章 聚类分析 聚类分析,亦称群分析或点群分析,它是研究对样品或指标进行分类的一种多元统计分析方法(它是研究多要素事物分类问题的数量方法)。所谓的类通俗地说就是相似元素的集合。 什么是分类? 分类是将一个观测对象指定到某一类(组)。 工商管理学院信息管理教研室 分类的问题可以分成两种: 一种是对当前所研究的问题已知它的类别数目,且知道各类的特征(如分布规律、或知道来自各类的训练样本),我们的目的是要将另一些未知类别的个体正确归属于其中某一类,这是判别分析所要解决的问题。 另一种是事先不知道研究问题应分成几类,更不知道观测的个体的具体分类情况,我们的目的正是需要通过对观测数据所进行的分析处理,选定一种度量个体接近程度的统计量、确定分类数目、建立一种分类方法, 工商管理学院信息管理教研室 并按亲近程度对观测对象给出合理的分类。这种问题在实际中大量存在,它正是聚类分析所要解决的问题。 工商管理学院信息管理教研室 第一节 聚类分析的方法 聚类分析的职能是建立一种分类方法,其基本原理是,根据样品(本)自身的属性,用数学方法按照某些相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。 工商管理学院信息管理教研室 聚类分析的方法 聚类分析的内容十分丰富,按其聚类的方法可分为以下几种: 1、系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其它类的距离或相近性测度。这一过程一直继续直到所有对象归为一类为止。 2、调优法(动态聚类法):首选对n个对象初步分类,然后根据分类的损失函数尽可能小的原则对分类进行调整,直到分类合理为止。 工商管理学院信息管理教研室 聚类分析的方法 3、最优分割法(有序样品聚类法):开始将所有样品看成一类,然后根据某种最优准则将它们分割为二类、三类,一直分割到所需的k类为止。这种方法适用于有序样品的分类问题,也称为有序样品的聚类法。 4、模糊聚类法:利用模糊集理论来处理分类问题,它对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果。 工商管理学院信息管理教研室 聚类分析的方法 5、图论聚类法:利用图论中最小支撑树的概念来处理分类问题,创造了独具风格的方法。 6、聚类预报法:利用聚类方法处理预报问题,在多元统计分析中,可用来做预报的方法很多,如回归分析和判断分析。但对一些异常数据,如气象中的灾害性天气的预报,回归或判断分析处理的效果都不好,而聚类预报弥补了这一不足,这是一个值得重视的方法。 工商管理学院信息管理教研室 R型聚类分析 聚类分析根据分类对象的不同分为R型和Q型在大类。 R型是对变量(指标)进行分类处理,R型聚类分析的目的有以下方面: (1)可以了解变量间及变量组合间的亲疏关系; (2)对变量进行分类; (3)根据分类结果及它们之间的关系,在每一类中选择有代表性的变量作为重要变量,利用少数几个重要变量进一步作分析计算,如进行回归分析或Q型聚类分析等。 工商管理学院信息管理教研室 Q型聚类分析 Q型是对样品进行分类处理。Q型聚类分析的目的主要是对样品进行分类。分类的结果是直观的,且比传统分类方法更细致、全面、合理。 当然使用不同的分类方法通常会得到不同的分类结果。对任何观测数据都没有惟一“正确的”的分类方法。实际应用中,常采用不同的分类方法,对数据进行分析计算,以便对分类提供意见,并由实际工作者决定所需要的分类数及分类情况。 工商管理学院信息管理教研室 第二节 聚类要素的数据处理 为了对样品(或变量)进行分类,就必须研究它们之间的关系。描述样品间亲疏相似程度的统计量很多,目前用得最多的是距离和相似系数,这两个统计量与变量的类型密切相关,为此我们首选分析一下变量的类型。 工商管理学院信息管理教研室 一、变量的类型 根据变量取值的不同可将变量分为以下几种: 1、名义变量:变量值是几个没有次序之分的不同状态,它给变量值赋予名称。例如,性别、汽车品牌 、职业、血型、是否患病、喜爱的颜色等等都是名义变量。 2、有序变量:变量值是严格有次序的不同状态。例如产品按质量分为:不好、一般、好、很好。文化程度分为高、中、低等。 工商管理

您可能关注的文档

文档评论(0)

czy2014 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档