- 9
- 0
- 约1.19万字
- 约 46页
- 2017-06-16 发布于贵州
- 举报
第一章 化学信学-绪论
1.3.3.3 聚类(Clustering) 聚类分析(CA)是由Tryon在1939第一个使用,事实上CA 包含了大量的分类算法。一个最普通的是如何使用分类学将实验数据分成有意义的不同类别。CA的方法就是为了解决这个问题。目前,已有许多的CA算法,总的可以分成两类:即分级聚类和不分级聚类。分级聚类将研究的对象按树状结构进行重新安排。 Javis-Patrick是最早使用CA对化学结构进行聚类的。正确的聚类分析要依靠下面三点: (1)选用适当的结构表示;(2)选用合适的数据标准化方法;(3)选择合适的聚类分析算法和适当的参数设置。当大量的实验数据的实验条件和量刚不一样时,数据标准化是这些数据能够进行比较的基础。 线性标准化: 比例标准化: Z-score标准化: 一般地,线性标准化使用的较多,Z-score标准化必须要求xi 符合Gaussian 分布。聚类分析的一个缺点是在进行聚类分析之前必须先确定数据应该分成几类,并且不容许出现奇异数据。 1.3.3.4 分割聚类(Partition clustering) 分割算法也有许多种,如二杈树,非参数法等。由于很难使用回归或参数分类法对奇异数据类型进行分类,过多的描述符也使得聚类分析无法进行,一般就用二杈树方法解决这类问题。目前最常用的二杈树算法是递归分割(recursive p
您可能关注的文档
- 第一章 人力资管理 绪论.ppt
- 第一章 人生如,心门即生门.ppt
- 第一章 从世界中国(复习课件).ppt
- 第一章 会计学础理论.ppt
- 第一章 会计的本概念、对象和任务.ppt
- 第一章 信息安基础.ppt
- 第一章 儒释道论异同及其文化内涵.ppt
- 第一章 全球化的饭店业.ppt
- 第一章 区域地环境与人类活动 第三节 区域发展差异.ppt
- 第一章 原始歌与神话.ppt
- 2024-2025学年湖南省邵阳市新宁县回龙寺镇人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市平原县王杲铺中小、王凤楼中小、腰站镇中小青岛版一年级下册3月月考数学试卷.docx
- 第四单元 课题3 物质组成的表示-初中化学新教材预习学案(人教版2024九年级上册).docx
- 2024-2025学年山东省济宁市梁山县人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市德州经济技术开发区长河小学等校青岛版一年级下册期中考试数学试卷.docx
- 2026《基于国产开源单片机GD32VF103的输变电设备物联网传感器设计》8300字.docx
- 2024年中考道德与法治真题完全解读(北京卷).docx
- 2026《基于机器视觉识别的工件边缘曲线重构方法分析》9000字.docx
- 课时9.4 物体的浮与沉【一大题型】八年级全一册物理(沪科版2024).docx
- 2024-2025学年广东省江门市开平市人教版一年级下册期中综合素养评价数学试卷.docx
原创力文档

文档评论(0)