- 2
- 0
- 约3.72千字
- 约 50页
- 2018-03-24 发布于湖北
- 举报
第二章 聚类分析 分类与聚类的区别 分类:用已知类别的样本训练集来设计分类器(监督学习) 聚类(集群):用事先不知类别的样本,而利用样本的先验知识来构造分类器(无监督学习) 2.1聚类分析的概念 基本思想: 对一批没有标明类别及类数的模式样本集,根据模式间的相似程度,按照物以类聚、人以群分的思想,将相似的模式分为一类,不相似的分为另一类。 特征的类型 1.低层特征: ①无序尺度:有明确的数量和数值。 ②有序尺度:有先后、好坏的次序关系,如酒 分为上,中,下三个等级。 ③名义尺度:无数量、无次序关系,如有红, 黄两种颜色 2. 中层特征:经过计算,变换得到的特征 3. 高层特征:在中层特征的基础上有目的的经过运 算形成 例如:椅子的重量 体积*比重 体积与长,宽,高有关;比重与材料,纹理,颜色有关。这里低、中、高三层特征都有了。 方法的有效性 特征选取不当 特征过少 特征过多 量纲问题 主要聚类分析技术 谱系法(系统聚类,层次聚类法) 基于目标函数的聚类法(动态聚类) 图论聚类法 模糊聚类分析法 2.2模式相似度度量 各种距离表示相似性: ① 绝对值距离 已知两个样本 xi xi1, xi2 , xi3,…,xin T xj xj1, xj2 , xj3,…,xjn T ② 欧几里德距离 ③明考夫斯基距离 其中当q 1时为绝对值距离,当q 2
您可能关注的文档
最近下载
- 2025年上海铁路局集团有限公司招聘3347人二(高等职业院校)(公共基础知识)测试题附答案.docx VIP
- 预防纠正措施培训.ppt VIP
- 中国共产主义青年团团员登记表(2025年版).docx VIP
- 家政行业年后服务人员培训与客户拓展【PPT文档】.pptx VIP
- 《因果推断实用计量方法》大学教学课件 第9章 双重差分法.pptx VIP
- 2024深信服PT1-aDesk认证实验考试.doc VIP
- 【护理PPT分享】肿瘤患者肠内营养耐受不良专家共识.pptx
- 新概念英语第二册+Lesson+64+The+channel+tunnel+讲义.docx VIP
- 富平县辅警考试真题及答案2022 .pdf VIP
- (正式版)DB54∕T 0117-2017 《西藏生态安全屏障生态监测技术规范》.docx VIP
原创力文档

文档评论(0)