数据挖掘中聚类题的研究.pdf

数据挖掘中聚类题的研究

\数据库技术和Intemet的发展使得收集和存储海量数据成为可能,面对越来 越多迅速膨胀的数据,人们往往无从着手去理解数据中包含的信息,更难以获 得有价值的知识,从而面临着“数据丰富,知识贫乏”的局面。传统的信息处 理技术已经不能很好地满足实际应用的需求,人们迫切需要具有更强能力和更 高效率的信息处理技术,从大量数据中发现感兴趣的知识,从而指导决策。数 据挖掘技术就是在这种应用背景下产生的。 数据挖掘是从大型数据库和数据仓库中发现人们感兴趣的知识的处理过 程。而聚类分析是数据挖掘领域中一个重要的研究课题。聚类是根据物以类聚 的原则,将d维数据空间中给定的n个点聚成k类,使得类内所有点的相似程 度大于类间点的相似程度。卜,一 / 在对数据挖掘中聚类问题的国内外研究现状进行了详细调研的基础上,本 文从对聚类算法初值敏感性的改进和对其可继承性的研究两个方面着手,对几 种常见的有代表性的聚类算法进行了深层次的研究,对其有效性、效率等方面 进行了分析,并提出新的改进算法,通过实验与分析,证明新算法能更准确、 有效地挖掘聚类模式。 , 旧前国内对于数据挖掘的研究工作绝大部分是集中于局部的算法设计,对 综合的系统集成设计的研究却比较少见。因此,智能信息系统实验室从数据挖 掘的

文档评论(0)

1亿VIP精品文档

相关文档