- 3
- 0
- 约4.94千字
- 约 42页
- 2018-02-21 发布于河南
- 举报
模式识别讲义--聚类分析
聚类分析(Clustering Analysis) 分类与聚类的区别 分类:用已知类别的样本训练集来设计分类器(监督学习) 聚类(集群):用事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习) 聚类分析 解决主要问题 1.如何评价样本间的类似程度; 2.如何根据样本间的类似程度聚类。 特征量的类型 1.物理量:反映实际物理或几何意义,如重量 2.次序量:只反映次序关系,如产品等级等 3.名义量:只用数字代表各种状态,如性别编码 方法有效性 1.特征选取不当 2.特征选取不足 3.特征选取过多 4.量纲选取不当 模式相似性测度 距离测度:以两个矢量矢端的距离为基础 1.欧式距离:(Euclidean) 2.绝对值距离:(Manhattan) 3.切氏距离:(Chebyshev) 距离测度 4.明氏距离:(Minkowski) 5.马氏距离(Mahalanobis) 类的定义 1.集合S中任意两个元素xi,xj的距离dij满足如下条件之一,则S对于阈值h组成一类,h为阈值。 2.集合S中元素满足对于任一xi,存在xj的距离dij满足dij ≤h,则S对于阈值h组成一类,h为阈值。 3.若将集合任意分为两类S1,S2,这两类间的距离D(S1,S2)满足D(S
您可能关注的文档
- 课堂教学中的个别化指导.doc
- 选择性发射极太阳电池结构及其实现方法.doc
- 通报表扬与批评.doc
- 长春版七上古诗文默写doc.doc
- 部内推优方案.doc
- 页码问题四奥数.doc
- 高三下学期英语应该如何复习.doc
- 1kV电力电缆国网技术规范通用部分(完.doc
- 2011年高考数学难点突破专题辅导.doc
- 0801020101第一节(第一课时)中国的地形.ppt
- 计算机二级MS Excel2026年高频考点含解析.docx
- 计算机二级MS Office2026年冲刺卷含解析.docx
- 计算机二级MS Office高级应用2026年冲刺全真模拟含解析.docx
- 计算机二级MS Office高级应用2026年押题高频考点含解析.docx
- 2026年新高考全国卷一数学导数易错题预测卷含解析.docx
- 2026年新高考全国卷语文压轴题模拟卷含解析.docx
- 2026年新高考全国乙卷高考数学易错题卷(含解析).docx
- 2026年新高考生物稳态调节专题预测分析卷(含解析).docx
- 2026年新课标 I 卷高考化学易错点专项模拟卷含解析.docx
- 2026年新课标 I 卷高考生物押题模拟卷含解析.docx
原创力文档

文档评论(0)