- 1、本文档共79页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章系统分析
中国矿业大学管理学院
本章主要内容
第一节:相关分析与回归分析
第二节:主成分分析
第三节:系统聚类分析
第四节:模糊聚类分析
第三节 系统聚类分析
中国矿业大学管理学院
聚类分析又称群分析,它是研究(样品或指
标)分类问题的一种多元统计方法,所谓类,
通俗地说,就是指相似元素的集合。严格的数
学定义是较麻烦的,在不同问题中类的定义是
不同的。
聚类分析是研究多要素事物分类问题的数量方
法。基本原理是根据样本自身的属性,用数学
方法按照某种相似性或差异性指标,定量地确
定样本之间的亲疏关系,并按这种亲疏关系程
度对样本进行聚类。
常见的聚类分析方法有系统聚类法、动态聚类
法和模糊聚类法等,下面主要介绍常用的系统
聚类法 。
主要内容
聚类要素的数据处理
距离的计算
直接聚类法
最短距离聚类法
最远距离聚类法
计算类之间距离的统一公式
系统聚类法的性质
系统聚类分析实例
一、聚类要素的数据处理
在聚类分析中,聚类要素的选择是十分重
要的,它直接影响分类结果的准确性和可靠
性。
在管理问题研究中,被聚类的对象常常是
多个要素构成的。不同要素的数据往往具有不
同的单位和量纲,其数值的变异可能是很大
的,这就会对分类结果产生影响。因此当分类
要素的对象确定之后,在进行聚类分析之前,
首先要对聚类要素进行数据处理。
假设有m 个聚类的对象,每一个聚类对象
都有n个要素构成。它们所对应的要素数据可
用表1给出。
表1 聚类对象与要素数据
要 素
聚 类 对 象 x1 x 2 , x j , x n
1 x11 x12 , x1j , x1n
2 x 21 x22 , x 2j , x2n
i xi1 xi 2 , xij , xin
m
xm1 xm 2 , xmj , xmn
在聚类分析中,常用的聚类要素的数据处理方
法有如下几种:
① 总和标准化。分别求出各聚类要素所对应的
数据的总和,以各要素的数据除以该要素的数
据的总和,即
x
ij
xij m (i 1,2, , m;j 1,2, , n) (1)
xij
i 1
这种标准化方法所得到的新数据满足
m
x 1 (j 1,2, , n)
ij
i 1
② 标准差标准化,即
x x
x ij j (i 1,2 , , m ; j 1,2 , , n ) (2 )
ij
s
j
由这种标准化方法所得到的新数据,各要素的
平均值为0,标准差为1,即有
1 m 1 m 2
x j x ij 0
文档评论(0)