遗传算法在数据挖掘中的研究与应用资料.docx

遗传算法在数据挖掘中的研究与应用资料.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
遗传算法在数据挖掘中的研究与应用 学院: 计算机学院 班级: 计研-14 学号: 2deeeeeeeeeee 姓名: 笑嘻嘻 2015年1月 遗传算法在数据挖掘中的研究与应用 摘 要 遗传算法(genectialgoritlllnn,GA)是一种模拟生物进化过程的自适应全局优化算法,是解决现代非线性优化问题的一种重要方法。对于大量数据的嘈杂无序的特征,遗传算法是有效解决此类问题的方法之一。它模拟自然选择和生物遗传机制,利用遗传算子产生后代,通过群体的迭代,使个体的适应性不断提高,最终群体中适应值最高的个体即是优化问题的最优或次优解。 数据挖掘(DataMining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,集成了数据库、人工智能、数理统计、可视化、并行计算等技术。 关联规则作为数据挖掘领域的一个重要研究分支,针对关联规则挖掘中经典算法-Aprior算法的局限性,在划分技术的基础上提出了一种基于遗传算法的关联规则挖掘模型。 分类是数据挖掘中最重要的方法之一,决策树作为发现分类模型的常用技术现已被广泛研究并取得了很大的进展。然而,在决策树的构造过程中采用贪心算法,造成了决策树容易过分拟合、规模过大、产生的规则长度过长等缺点。针对这些缺陷,提出了一种基于遗传算法与关联规则算法的混合分类挖掘方法。本论文主要围绕着遗传算法应用于数据挖掘研究展开,基本上分为四部分: (1)对KDD(Knowledge Discovery in Database)技术进行了总体上的概述,包括KDD的含义、一般过程、主要方法和技术、研究的现状及存在的问题等,为在这一领域进行更为深入的研究打下初步基础。在此基础之上对发现分类模型的各种技术以及关联规则挖掘算法进行了较为全面的研究。 (2)对遗传算法的编码方法、适应度函数、遗传操作算子、参数的选择作了全面且深入的研究。 (3)对提出的基于遗传算法的关联规则挖掘方法进行了全面的描述。 (4)对提出的基于遗传算法与关联规则算法相结合的混合分类方法进行了全面的分析。 关键词 遗传算法;数据挖掘;分类;关联规则 Research and Application on Data Mining based on Genetic Algorithm Abstract Genetic Algorithm is a kind of global optimization algorithm which simulates the process of biological evolution, its a important method to settle modern nonlinear optimization problems. For the chaos of the vest data, Genetic Algorithm is one of the effective methods that can solve this kind of question. It simulates natural selection and biological genetic mechanism and generates the offspring by genetic operators. Through the iterativeness of population, the fitnesses of the individuals is improved and finally the individual with the highest fitness just is the optimal solution or suboptimal solution of the optimization problem. Data Mining(DM) is a process that pick previously unknown and potentially useful information and technology from large volumes of incomplete, fuzzy and stochastic data with noise. It made use research achievements of many years in the areas of stati

文档评论(0)

x5511167 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档