- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于遗传算法的k-means聚类挖掘算法的研究
摘 要
数据挖掘是随着信息技术不断发展而形成的一门新学科,是信息处理和数据库技术领域的一个新兴的研究热点。数据挖掘的任务是从海量数据中发现隐含的有用知识,为科学决策提供支持。
聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督的分类方法,目标是在没有任何先验知识的情况下,将数据集划分成不同的类,使得相同类中的对象尽可能相似,不同类中的对象尽可能相异。k-means算法作为聚类分析中的经典算法现已被广泛应用在商务、市场分析、生物学、文本分类等领域。然而,k-means算法具有对初始值敏感、易陷入局部极小值等缺点。因此,改进 k-means算法以进一步提高聚类效果具有十分重要的意义。
本文首先详细地介绍了聚类分析技术,对现有的聚类算法进行了分类,分析了这些算法的优缺点,并在此基础上,重点研究了k-means算法。
其次,全面分析了数据挖掘中的一个重要算法——遗传算法。在此基础上,结合k-means算法的思想和特点,提出了一种改进的遗传k-means聚类算法,从编码方法、适应度函数的构造、交叉算子和变异算子的设计、k-means优化操作等方面进行了详细的讨论和分析。
最后,为了测试本文提出的聚类算法的性能,本文用k-means算法和改进的算法进行了三组实验,并对两种算法的聚类结果进行比较,实验结果表明本文算法能够有效地解决聚类问题。
关键词:数据挖掘 聚类分析 遗传算法 k-means算法 改进的遗传k-means算法
R DATA MINING BASED ON GENETIC ALGORITHM
ABSTRACT
Data mining is a new subject formed with the development of the information technology and is a new research point in the information and database technology. The purpose of data mining is to discovery hidden and useful knowledge from huge amounts of data, which can support the science decision.
Cluster analysis is one of the important themes in data mining. Clustering is a unsupervised classifying method, the goal of clustering is to partition data set into such clusters that objects within a cluster have high similarity in comparison to one another, but are very dissimilar to objects in other clusters without any prior knowledge. As a classical method of clustering analysis, k-means has been widely used in commerce, market analysis, biology, text classification and so on. However k-means has two severe defects—sensitive to initial data and easy to get into a local optimum. On this condition, improving k-means is an effective method to get better clustering result.
Firstly, the dissertation detailedly introduce clustering analysis technology, and most existing clustering algorithms are classified, analysis their advantages and disadvantages. On the basis, the dissertation chooses k-means as research target.
Secondly, analyzing an important method—genetic algorithms in data mining.
您可能关注的文档
- RNAi与应用中相关同位素示踪技术.pdf
- RNA沉默机制及介导植物抗病毒基因工程的研究进展.pdf
- RNA沉默在植物逆境生物中作用.doc
- Robot 在自动机中多工位应用.doc
- Si(Ni-Cr合金)Cu扩散偶950℃时界面反应.pdf
- simulate 控制系统模型及转换.doc
- SiO2复合粒子对硅橡胶性能影响.pdf
- SiO2纳米干凝胶合成和表征.doc
- SiO_2_PSf杂化超滤膜制备和性能的研究.pdf
- SO2吸收塔橡胶内衬层改造(论文).doc
- 课题申报书:数字化赋能高校思想政治教育的现实困境与提升路径研究.docx
- 课题申报书:数字化赋能青少年脊柱健康促进的路径研究.docx
- 课题申报书:数字化数学教学资源建设.docx
- 课题申报书:数智时代职业教育高质量发展的绩效评价改革与实践研究.docx
- 课题申报书:数字化国际化课程建设与创新人才培养模式研究.docx
- 课题申报书:数字赋能地方政府职业教育治理的内在机理与实施路径研究.docx
- 课题申报书:数字赋能高校课程教与学全过程评价机制与应用研究.docx
- 人教版数学四年级上册期末测试卷及参考答案(夺分金卷).docx
- 安全教育宣讲实施纲要.pptx
- 学雷锋主题实践教育活动策划与实施.pptx
最近下载
- 铁路局招聘考试《铁路基础知识》100题及答案.docx
- 《QSY1237-2009-工艺和设备变更管理》.pdf
- 期末复习专项训练【实验题】(试题)小学科学五年级上册 教科版.docx VIP
- 农旅融合:推进乡村振兴,实现双赢.docx VIP
- 技术标书技术方案(完整资料).pdf VIP
- 13G311-1:混凝土结构加固构造.pdf VIP
- DB21_T 1565-2015预应力混凝土管桩基础技术规程.pdf
- 夏季防暑降温施工方案_夏季防暑降温施工方案夏季防暑降温工作方案.pdf VIP
- 危重症患者口渴的护理PPT.pptx
- 八年级人教版物理下《12.2滑轮》一等奖优秀教学设计 .pdf VIP
文档评论(0)