- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一. 样本点之间的相似性测度 ——距离 ei∈R p ei与ek的相似程度: d2(ei,ek) 定义:距离 d(· ,·):? ? ? ? R+ ① d(x,y)≥0 ?x,y? ? (正定性) d(x,y) = 0 当且仅当 x=y ② d(x,y) = d(y,x) (对称性) ③ d(x,y) ? d(x,z) + d(z,y) (三角不等式) 二. 类与类之间的相似性测度——聚合指数 问题:如果有两类G1,G2,怎么测量它们之间距离? — “聚合指数” 系统聚类是逐步过程: 1. 最短距离法: I II III 一类 二类 Dmin Dmax 2. 最长距离法: 3. 重心法: 4. 类平均法: 等于G1和G2中所有样本点间距离的平均。 Dg 5. 离差平方和法: 定义: D(G1,G2)=D1+2-D1-D2 事实上:若G1和G2均能自身充分聚合,并且G1和G2又充分分离,则有D1+2-D1-D2很大。 D1 D1+2 D2 组间变差 三. 定量变量聚类分析 例:推销员问题 首先明确: ?用什么方法测度距离d2(wi,wk) ? ②用什么方法测度聚合指数D(G1,G2)? 最短距离法: I. 构造距离矩阵: Ⅱ. w1……w5自成一类: h1……h5 选择最接近的两元素聚成一类: III. 计算新类之间的关系:w3, w4,w5 , h6 D(w3,h6)=min{d(w3,w1),d(w3,w2)} =min{4,3}=3 D(w4,h6)=min{d(w4,w1),d(w4,w2)} =min{6,5}=5 D(w5,h6)=min{6,5}= 5 取最相似的并成一类: IV. 计算新类之间的关系:w5 h6 h7 取最相似并为一类:h8=h6?h7 平台高度: f(h8)=3 V. 计算新类关系:w5 ,h8 D(w5,h8)=min{D(w5,h6),D(w5,h7)}=min{4,5}=4 h9=w5∪h8 f(h9)=4 由于所有点已聚为一类,计算停止,转入绘聚类图. VI. 绘制聚类图:二分树法 分成二类:(w1 w2 w3 w4)(w5) 分成三类:(w1,w2),(w3,w4),(w5) 全体的类集合:{h1……h5 ,h6,h7,h8,h9} h6 h7 h8 h9 f (h) 1 2 4 3 h9 ╱ ╲ h8 w5 ╱ ╲ h6 h7 ╱ ╲ ╱ ╲ w1 w2 w3 w4 (二)聚合指数:最大距离法 ? 测度距离 d2(wi,wk) ② 测度聚合指数 D(G1,G2) 最大距离法: I. 构造距离矩阵: II. w1……w5自成一类; 选择最接近的两元素聚成一类: III. 计算新类之间的关系:w3 w4 w5 h6 D(w3,h6)=max{d(w3,w1),d(w3,w2)} =max{4,3}= 4 D(w4,h6)=max{d(w4,w1),d(w4,w2)} =max{6,5}= 6 D(w5,h6)=max{6,5}= 6 取最相似的并成一类: IV. 计算新类之间的关系:w5 h6 h7 取最相似并为一类:h8=w5 ?h7 平台高度: f(h8)=4 V. 计算新类关系:h6 ,h8 D(h6,h8)=max{D(h6 ,w5),D(h6,h7)}=max{6,6}=6 h9=h6∪h8 f(h9)=6 由于所有点已聚为一类,计算停止,转入绘聚类图. VI. 绘制聚类图:二分树法 分成二类:(w1,w2 ),(w3,w4,w5) 分成三类:(w1,w2),(w3,w4),(w5) 全体的类集合:{h1……h5 ,h6,h7,h8,h9} h6 h7 h8 h9 f (h) 1 2 6 4 h9 ╱ ╲ h6 h8 ╱╲ ╱╲ w1 w2 w5 h7 ╱╲ w3 w4 怎样判断 应分为几类更合适 谱系图:标度突变法 SPSS软件应用(drink. sav) 1、系统聚类法
您可能关注的文档
最近下载
- 人教版初中化学九年级上册 第五单元 化学方程式 课题3 利用化学方程式的简单计算 大单元整体教学设计 .pdf VIP
- 2024年上海市长宁区中考英语二模试卷.docx VIP
- 2024年深圳市育才二中初一入学分班考试数学模拟试卷附答案解析.pdf VIP
- 最新部编版一年级语文上册第八单元学历案(2024).doc
- 2025年新疆生产建设兵团继续教育公需课答案.docx
- DW15-630型断路器要点分析.doc
- 2025年7月到九月份的思想汇报.docx VIP
- 2024年上海市嘉定区中考英语二模试卷.docx VIP
- 上海市2024年虹口区中考英语二模试卷.pdf VIP
- 土力学直剪试验(完整报告,含实验数据、强度图).doc VIP
文档评论(0)