毕业论文(赵艳稿).docVIP

下载本文档

7
0
约4.56万字
约 70页
2016-10-12 发布于贵州
举报

毕业论文(赵艳稿).doc

毕业论文(赵艳稿)

基于遗传算法的k-means聚类挖掘算法的研究摘要数据挖掘是随着信息技术不断发展而形成的一门新学科，是信息处理和数据库技术领域的一个新兴的研究热点。数据挖掘的任务是从海量数据中发现隐含的有用知识，为科学决策提供支持。聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督的分类方法，目标是在没有任何先验知识的情况下，将数据集划分成不同的类，使得相同类中的对象尽可能相似，不同类中的对象尽可能相异。k-means算法作为聚类分析中的经典算法现已被广泛应用在商务、市场分析、生物学、文本分类等领域。然而，k-means算法具有对初始值敏感、易陷入局部极小值等缺点。因此，改进 k-means算法以进一步提高聚类效果具有十分重要的意义。本文首先详细地介绍了聚类分析技术，对现有的聚类算法进行了分类，分析了这些算法的优缺点，并在此基础上，重点研究了k-means算法。其次，全面分析了数据挖掘中的一个重要算法——遗传算法。在此基础上，结合k-means算法的思想和特点，提出了一种改进的遗传k-means聚类算法，从编码方法、适应度函数的构造、交叉算子和变异算子的设计、k-means优化操作等方面进行了详细的讨论和分析。最后，为了测试本文提出的聚类算法的性能，本文用k-means算法和改进的算法进行了三组实验，并对两种算法的聚类结果进行比较，实验结果表明本文算法能够有效地解

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

毕业论文(赵艳稿).docVIP