- 11
- 0
- 约3.57千字
- 约 16页
- 2017-05-22 发布于河南
- 举报
浅谈聚类(Clustering)算法 1.引言 数据挖掘:指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。它是人工智能和数据库发展相结合的产物,是国际上数据库和信息决策系统最前沿的研究方向之一。数据挖掘主要的算法有分类模式、关联规则、决策树、序列模式、聚类模式分析、神经网络算法等等。 聚类是数据挖掘中的一个非常重要的研究课题,广泛应用于各个领域,它对未知数能达到合理的效果。研究和运用聚类是完成数据挖掘任务的重要手段,因此对聚类的研究具有重要的理论价值和现实意义。 2.聚类算法基本原理概述 俗话说:“人以群分,物以类聚”。聚类就是利用计算机技术来实现这一目的的一种技术。聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。 聚类与分类不同:分类问题中我们知道数据集的分类属性。而聚类问题则需要我们从数据集中找这个分类属性。 迄今为止,聚类还没有一个学术界公认的定义.这里给出Everitt在1974 年关于聚类所下的定义:一个类簇内的实体是相似的,不同类簇的实体是不相似的;一个类簇是测试空间中点的会聚,同一类簇的任意两个点间的距离小于不同类簇的任意两个点间的距离;类簇可以描述为一个包含密度相对较高的点集的多维空间中的连通区域,它们借助包含密度相对较低的点集的区
您可能关注的文档
- 感觉系统_1幻灯片.ppt
- 高等数学-第三版1-1函数课件.ppt
- 高尔夫--幻灯片.ppt
- 高晶---教师心理课件.ppt
- 高考化学总复习一轮精品:《实验基础知识》-2课件.ppt
- 高职大学生心理健康与成长 -8课件.ppt
- 高中BOOK7Unit 1 Language points课件.ppt
- 高中政治把握思维的奥妙人教版必修4课件.ppt
- 公共卫生均等化统培训郝东升 -1课件.ppt
- 肱骨外上髁炎幻灯片.ppt
- 50万吨汽油调和技改项目环评报告书.pdf
- 河北省文安县第一中学2025-2026学年高一上学期10月月考英语试题(解析版).docx
- 河南省TOP二十校205—2026学年高一上学期10月联考生物试题(原卷版).docx
- 河南省安阳市第一中学、鹤壁市高中、新乡市第一中学三校2025-2026学年高一上学期第一次联考数学试题(解析版).docx
- 河南省部分高中2025-2026学年高一上学期第二次月考数学试卷(解析版).docx
- 河南省百师联盟2025-2026学年高二10月联考数学试题(北师大版)(解析版).docx
- 河南省部分学校2025-2026学年高一上学期期中考试数学试题(解析版).docx
- 河南省部分重点中学2025~2026学年高二上学期10月末质量检测数学试题(解析版).docx
- 河南省部分重点中学2025-2026学年高二上学期10月末质量检测英语试题(解析版).docx
- 桥梁伸缩缝安装工艺(可编辑).pptx
原创力文档

文档评论(0)