交通数据处理与分析第三章聚类分析剖析
Cophenet函数 Cophenet函数用来计算系统聚类树的cophenetic相关系数 Cophenetic相关系数反映了聚类效果的好坏,cophenetic相关系数越接近于1,说明聚类效果越好,可通过Cophenetic相关系数对比各种不同的距离计算方法和不同的系统聚类法的聚类效果 c = cophenet(Z, Y) [c, d] = cophenet(Z, Y) 在上述调用中,cophenet函数用pdist函数输出的Y和linkage函数输出的Z计算系统聚类树的cophenetic相关系数。输出参数c为Cophenetic相关系数,d为cophenetic距离向量,d与Y等长,c是d与Y之间的线性相关系数。 inconsistent函数 用来计算系统聚类树矩阵Z中每次并类得到的链接的不一致系数,其调用格式如下 Y = inconsistent(Z) Y = inconsistent(Z,d) 参数Y是一个(n-1)*4的矩阵,各列的含义如下 列序号 说明 1 计算设计的所有链接长度(即并类距离)的均值 2 计算涉及的所有链接长度的标准差 3 计算涉及的链接个数 4 不一致系数 不一致系数可用来确定最终的分类个数。在并类过程中,若某一次并类对应的不一致系数较上一次有大幅增加,说明该次并类效果不好,而它上一次的并类效果使比较好的,不一致系数增加的幅度越大,说明上一次并类效果越好。在使得类的个数尽量少的前提下,可参照不一致系数的变化,确定最终的分类数。 Culuster函数 Culuster在linkages函数的基础上创建聚类,并输出聚类结果。 Clusterdata 函数 调用了pdist、linkage和cluster函数,用来由原始眼根数据矩阵X创建系统聚类, T = clusterdata(X, cutoff) T = clusterdata(X, param1, val1, param2, val2, …) 输出参数T包含n个元素的列向量,其元素为响应观测所属类的类序号。Curfoo为阈值。 Clusterdata函数 T = clusterdata(X, cutoff) T = clusterdata(X, param1, val1, param2, val2, …) 参数名 参数值 含义 ‘distance’ Pdist函数所支持的metric参数的取值 指定距离的计算方法 ‘linkage’ Linkage函数所支持的method参数的取值 制定系统聚类方法 ‘cutoff’ 正实数 制定不一致系数或距离的阈值 ‘maxclust’ 正整数 制定最大类数 ‘criterion’ ‘inconsistent’或‘distance’ 指定聚类的标准 * * * * * * * * 3、计算新类⑥与各当前类的距离, 得距离矩阵如下: ② ③ ⑥ ① ② ③ 13 104 265 89 232 37 为最小, ⑦= ⑥ ⑦ ③ ⑥ 37 93.25 245.25 4、重复步骤2、3,合并距离最近的两类为新类,直到所有的类并为一类为止。 为最小,⑧= 5、 6、按聚类的过程画聚类谱系图 4 5 ⑥ ⑨ ⑧ 并类距离 3 1 2 ⑦ 7、决定类的个数与类。 观察此图,我们可以把5个样品分为3类, 、 、 。 四、重心法(Centroid) ? ? 和 类与类之间的距离就考虑用重心之间的距离表示。设p与q的重心分别是 ,则类p和q的距离为 将p和q合并为k,则k类的样品个数为 它的重心是 某一类 r 的重心是 ,它与新类k的距离是 经推导可以得到如下递推公式: 设聚类到某一步,类p与 q分别有样品 、 个, ② ③ ④ ⑤ ① ② ③ ④ 13 104 260 272 89 221 245 36 40 4 计算5个样品两两之间的距离 记为距离矩阵 (采用欧氏距离), 2. 合并距离最小的两类为新类,按顺序定为第6类。 ⑥= 例 重心法 3、计算新
您可能关注的文档
- 亚洲国际超模大赛剖析.ppt
- PCB检验标准汇编.docx
- 交流发电机构造1剖析.ppt
- 亚荣质量意识培训资料剖析.ppt
- 亚洲硅谷-班加罗尔(改)剖析.ppt
- 交流发电机工作特性剖析.ppt
- 交流发电机__第一讲剖析.ppt
- 交流测速发电机剖析.ppt
- 交流发电机的工作原理剖析.ppt
- PCM+培训汇编.ppt
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
最近下载
- ISO9001-2026质量管理体系标准版中英文及变化点解析.pdf VIP
- HGT 21629-1999 管架标准图(四).docx VIP
- 广州市民办学校申办审批表.doc VIP
- 无人机测绘技术与应用课件21--无人机驾驶员职业规划.ppt
- 2025年袋鼠数学LevelB试卷及答案.pdf VIP
- 《重症凝血病标准化评估中国专家共识(2025)》解读PPT课件.pptx VIP
- 《动物防疫法》培训解读课件.pptx VIP
- 无人机测绘技术与应用课件20--无人机飞行原理.ppt
- 先进控制技术及其应用.docx VIP
- 2025-2026学年济南版(2024)初中生物八年级上册《血液是物质运输的载体》教学设计.docx
原创力文档

文档评论(0)