- 187
- 0
- 约1.94千字
- 约 5页
- 2016-02-29 发布于江苏
- 举报
聚类分析原理及步骤.doc
聚类分析原理及步骤
——将未知数据按相似程度分类到不同的类或簇的过程
传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
典型应用
动植物分类和对基因进行分类
在网上进行文档归类来修复信息
帮助电子商务的用户了解自己的客户,向客户提供更合适 的服务
主要步骤
数据预处理选择数量,类型和特征的标度特征选择和抽取“维数灾”进行聚类)和将孤立点移出数据(孤立点是不依附于一般数据行为或模型的数据为衡量数据点间的相似度定义一个距离函数Euclidean距离,经常被用作反映不同数据间的相异性,一些有关相似性的度量,例如PMC和SMC,能够被用来特征化不同数据的概念相似性,在图像聚类上,子图图像的误差更正能够被用来衡量两个图形的相似性
聚类或分组Crisp Clustering和Fuzzy Clusterin是划分方法的两个主要技术,Crisp Clustering,它的每一个数据都属于单独的类;Fuzzy Clustering,它的每个数据可能在任何一个类中)和层次方法(基于某个标准产生一个嵌套的划分系列,它可以度量不同类之间的相似性或一个类的可分离性用来合并和分裂类)是聚类分析的两个主要方法,另外还有基于密度的聚类,基
您可能关注的文档
- 组合夹具虚拟软件.ppt
- 织物免烫性测试.doc
- 织物的耐磨性试验.doc
- 织造学实验教程14个实验.doc
- 经济博弈论第三讲混合博弈.ppt
- 绘图的基本方法和步骤.doc
- 网友晒过年账单,折射不同年龄段人群消费观.doc
- 网络寄生虫检验.doc
- 网络机考考点场地设施设备参数表.doc
- 网络用语的流行与政治经济.ppt
- (2026)医院评审筹备与科室标准化建设工作总结(2篇).docx
- 2026年资质年检自查报告(2篇).docx
- 2026水库自查报告(2篇).docx
- 2026年北师大版适配小升初历史寒假衔接卷重大事件因果分析标准试卷第473套(含答案解析与可打印作答区).docx
- 河北唐山市2026年高三下学期第一次模拟演练物理试卷(解析版).pdf
- 六年级上册Unit 2物理练习:第2课时单词拼写与选择题.pdf
- 湖北省襄阳市第四中学2025-2026学年高三上学期教学质量检测(二)物理(II)试题(解析版).pdf
- 湖北省随州市六校2026年高三下学期一模物理试题(解析版).pdf
- 湖北省襄阳市枣阳二中2025-2026学年高三上学期一模物理试题(解析版).pdf
- 湖北省襄阳市枣阳二中2025-2026学年高三上学期一模物理试题(解析版).docx
原创力文档

文档评论(0)