数据挖掘中的进化计算综述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘中的进化计算综述.pdf

数据挖掘中的进化计算综述 ∗ 李晅松 (南京大学 计算机科学与技术系, 南京 210093) A Survey of Evolutionary computation in data mining Li Xuansong* (Department of Computer Science and Technology, Nanjing University, Nanjing 210093, China) Abstract: Evolutionary computation (EC) is an optimization process simulating natural evolution. It is a research hotspot on some domains of computer science such as AI. This paper introduces the fundamental theory of EC. And then, it discusses three aspects of genetic algorithms for rule discovery: individual representation, genetic operator and the design of fitness functions. The paper also takes neural networks as an example to show the research of combining evolutionary computation with other methods. Lastly, it shows the possible future research direction in this area. Key words: Evolutionary computation; genetic algorithm; data mining; rule discovery; artificial neural networks 摘 要: 进化计算是一种模拟生物进化的优化过程,它是计算机科学中人工智能等领域研究的热点。本 文介绍了进化计算的基本理论;从个体表示、遗传操作、适应度函数设计三个方面描述了用遗传算法进行 规则发现的过程;以神经网络为例介绍了对于进化计算与其他方法结合的研究。并分析了相关研究的发展 方向 关键词: 进化计算;遗传算法;数据挖掘;规则发现;神经网络 中图法分类号: TP18 文献标识码: A 1 引言 随着人类生产和搜集数据的能力大幅度提高,迫切需要找到从数据库和网络的大量数据中提取知识的 手段。然而,人类分析数据能力的进步进度远远落后与搜集存储数据的技术进步[1]。为了解决这个问题, 研究者引入了数据挖掘的概念和技术。数据挖掘(Data Mining )就是从大量的、不完全的、有噪声的、模 糊的、随机的数据中,提取可信、新颖、有效并能被人理解的信息和知识的高级处理过程[2]。 进化计算是一种使用进化过程的计算模型作为设计和执行的关键步骤的问题解决体系[3],它包括遗传 算法[4]、进化规划[5]、进化策略[6]、遗传编程[7]等。尽管进化计算有很多变化,它们都是基于达尔文等 生物学家在生物进化领域研究的成果建立起的计算模型。与传统的基于微积分的方法和穷举法等优化算法 相比,进化计算是一种成熟的具有高鲁棒性和广泛适用性的全局优化方法。具有自组织、自适应、自学习 的特性[8]。 本文主要探讨进化计算的方法用在数据挖掘中进行分类预测的规则发现。需要指出的是,进化计算的 方法在数据挖掘中的应用不仅限于此,它可用于评估其他算法的拟合度[2],还可以用于KDD 中预处理、后 ∗ 作者简介:李晅松,南京大学计算机科学与技术系研究生 加工阶段[1],限于篇幅,本文不对这些内容做过多说明。 本文组织如下:第二节对进化计算的基本理论和方法进行描述,重点介绍遗传算法,第三节描述在数 据挖掘的规则发现任务中使用进化算法的过程,第四节介绍进化算法与神经网络等方法的结合,第五节给 出总结和展望。 2 进化计算基本理论和方法 自然界的进化是一个基于种群的最优化过程。在处理复杂的现实问题时,用计算机中的随机技术模拟 这个过程往往可以得到比传统方法好的效果。目前,进化计算的研究主要分三个方面:遗传算法、进化规 划和进化策略[8]。本节详细介绍遗传算法的操作过程,并简要介绍进化规划、进化策略,通过比较描述进 化算法的要

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档