- 13
- 0
- 约6.2万字
- 约 51页
- 2016-03-17 发布于江苏
- 举报
摘要
摘要
数据挖掘是近年来热门的计算机应用技术,聚类是数据挖掘中重要的研究分
支。聚类技术是将未分类的样本,通过其相似度进行分类,使得类簇内部样本间
相似度最大,而不同类簇间相似度最小,从而发现数据集的特性和内部模式。然
而,一些数据集的结构和分布呈现高度复杂性,数据挖掘也为聚类带来了大量亟
待解决的问题。因此,聚类分析方法进一步研究的空间还很大。
层次聚类方法是一种常用的聚类算法,通过分解目标数据集来创建一个层次。
按照层次的分解方向,它分为自下而上(凝聚方法)和自上而下(分裂方法)两
种类型。
覆盖算法是构造型学习算法,通过找到一组覆盖,使得属于同一类的样本属
于同一覆盖,不同类的样本不属于同一覆盖。覆盖聚类算法借鉴覆盖算法的构造
性思想,找出一组覆盖,使得属于同一覆盖的样本间距离较小,不同覆盖间的样
本间距离较大。我们生活的宇宙,从最初的宇宙大爆炸,宇宙所有的物质都处于
混沌状态中,杂乱无章。由于万有引力的作用,使得宇宙中的物质相互吸引、靠
近,进而融合形成了星系,恒星,行星等天体。这一过程和数据聚类过程极为相
似,都是从最初混沌,通过对混沌中的个体进行某种聚类运算,最终得到结构清
晰的聚类结果。
您可能关注的文档
最近下载
- 游戏开发与运营投资协议.doc VIP
- 人教版二年级劳动下册全册教学课件.ppt
- 南京中医药大学2022-2023学年第1学期《宏观经济学》期末考试试卷(A卷)附标准答案.docx
- 2026年中考语文二轮专题复习:《病句辨析与修改》课件.pptx VIP
- 2025年上半年杨凌职业技术学院辅导员招聘试题及答案.docx
- 2025年湖南高中学业水平合格性考试化学试卷真题(含答案详解).pdf VIP
- 《儿童遗传代谢病防治体系建设规范》.pdf
- RCA耐磨测试仪操作指导书.xlsx VIP
- 国家开放大学《商务英语1》形考任务综合测试答案 .docx
- 泰山学院2024-2025学年第2学期《线性代数》期末试卷(A卷)及参考答案.docx
原创力文档

文档评论(0)