第五章聚类分析new.ppt
在已知类别的样本集基础上,用确定的或统计的判别函数对模式进行分类,设计分类器,这些已知的样本集称为训练集。根据判读好的训练集解决分类问题,称为有人管理或有教师的分类法。 第五章 聚类分析 没有训练集的情况下的样本分类问题,所选用的样本是预先不知其所属的类别,需要根据样本间的距离或相似性的程度自动地进行分类。 这种无人参预(或没有教师的)识别问题,称为聚类或无人管理的分类。 聚类分析方法是决定描述一个经验数据集的结构类型的一种非参数方法。 相似的数据被集中在一起,从数据集中分离出来,包含在特征空间中的一个模式集,其模式的密度比起周围区域中的密度大,就为一个聚类。 聚类原则:根据样本集,找出各点内在的相似性进行分类,相似的分为一类。 ⑴直观的相似性:从几何距离考虑,设阈值T,它是相似性度量的标准,靠经验确定,对分类影响很大。可用于粗分。 ⑵样本集群性(紧致性):同一类的应该群集,不同类的应该远离。 ⑶特征空间量纲标尺的选择:量纲选择不同,分类也有差异。 为了克服这个缺点,常使特征数据标准化,使它与变量量纲标尺没有关系。 5.1相似性度量和聚类准则 一般用归并相似的模式和分开不相似的模式以形成聚类。 相似性归并是聚类最普通的形式。 各式各样的相似性和距离度量已经作为特征空间中模式样本的聚类准则。 5.1.1相似性度量 Similarity measure 相似性度量将建
您可能关注的文档
最近下载
- 铸牢中华民族共同体意识面临的挑战与应对.docx VIP
- 2025年北方工业大学工商管理专业《管理学》科目期末试卷及答案.docx VIP
- (二模)苏北七市2026届高三第二次调研考试语文试卷(含官方答案).docx
- 跨文化交际角度鉴赏电影《刮痧》.ppt VIP
- 高三英语课件《HOW TO MAKE AN English Poster》.pptx VIP
- 细胞与基因治疗(CGT)CDMO市场现状.docx VIP
- 汽轮机低压缸进汽道气动性能改进地研究.pdf VIP
- 加辅料炒法麸炒.ppt VIP
- GB 51142-2015 液化石油气供应工程设计规范.docx VIP
- 《社会工作实务》助理社会工作师考试综合测试题(含答案及解析).docx VIP
原创力文档

文档评论(0)