- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘中的进化计算综述.pdf
数据挖掘中的进化计算综述
∗
李晅松
(南京大学 计算机科学与技术系, 南京 210093)
A Survey of Evolutionary computation in data mining
Li Xuansong*
(Department of Computer Science and Technology, Nanjing University, Nanjing 210093, China)
Abstract: Evolutionary computation (EC) is an optimization process simulating natural evolution. It is a research
hotspot on some domains of computer science such as AI. This paper introduces the fundamental theory of EC.
And then, it discusses three aspects of genetic algorithms for rule discovery: individual representation, genetic
operator and the design of fitness functions. The paper also takes neural networks as an example to show the
research of combining evolutionary computation with other methods. Lastly, it shows the possible future research
direction in this area.
Key words: Evolutionary computation; genetic algorithm; data mining; rule discovery; artificial neural networks
摘 要: 进化计算是一种模拟生物进化的优化过程,它是计算机科学中人工智能等领域研究的热点。本
文介绍了进化计算的基本理论;从个体表示、遗传操作、适应度函数设计三个方面描述了用遗传算法进行
规则发现的过程;以神经网络为例介绍了对于进化计算与其他方法结合的研究。并分析了相关研究的发展
方向
关键词: 进化计算;遗传算法;数据挖掘;规则发现;神经网络
中图法分类号: TP18 文献标识码: A
1 引言
随着人类生产和搜集数据的能力大幅度提高,迫切需要找到从数据库和网络的大量数据中提取知识的
手段。然而,人类分析数据能力的进步进度远远落后与搜集存储数据的技术进步[1]。为了解决这个问题,
研究者引入了数据挖掘的概念和技术。数据挖掘(Data Mining )就是从大量的、不完全的、有噪声的、模
糊的、随机的数据中,提取可信、新颖、有效并能被人理解的信息和知识的高级处理过程[2]。
进化计算是一种使用进化过程的计算模型作为设计和执行的关键步骤的问题解决体系[3],它包括遗传
算法[4]、进化规划[5]、进化策略[6]、遗传编程[7]等。尽管进化计算有很多变化,它们都是基于达尔文等
生物学家在生物进化领域研究的成果建立起的计算模型。与传统的基于微积分的方法和穷举法等优化算法
相比,进化计算是一种成熟的具有高鲁棒性和广泛适用性的全局优化方法。具有自组织、自适应、自学习
的特性[8]。
本文主要探讨进化计算的方法用在数据挖掘中进行分类预测的规则发现。需要指出的是,进化计算的
方法在数据挖掘中的应用不仅限于此,它可用于评估其他算法的拟合度[2],还可以用于KDD 中预处理、后
∗ 作者简介:李晅松,南京大学计算机科学与技术系研究生
加工阶段[1],限于篇幅,本文不对这些内容做过多说明。
本文组织如下:第二节对进化计算的基本理论和方法进行描述,重点介绍遗传算法,第三节描述在数
据挖掘的规则发现任务中使用进化算法的过程,第四节介绍进化算法与神经网络等方法的结合,第五节给
出总结和展望。
2 进化计算基本理论和方法
自然界的进化是一个基于种群的最优化过程。在处理复杂的现实问题时,用计算机中的随机技术模拟
这个过程往往可以得到比传统方法好的效果。目前,进化计算的研究主要分三个方面:遗传算法、进化规
划和进化策略[8]。本节详细介绍遗传算法的操作过程,并简要介绍进化规划、进化策略,通过比较描述进
化算法的要
您可能关注的文档
最近下载
- 高一数学(必修二)立体几何初步单元测试卷及答案.docx VIP
- “二次元经济”崛起背后的商业逻辑.docx VIP
- 【阶段测试】人教版数学六年级上册第一单元《分数乘法》单元测试卷27.doc VIP
- 中国谷子经济分析:从哪吒旋风看二次元IP衍生品市场崛起.pdf VIP
- 2025年全国高考山东省物理真题试卷(含答案).pdf
- 2025年人教版数学六年级上册单元测试卷-第一单元 分数乘法(含答案).pdf VIP
- 《不负'食'光拒绝浪费》班会课件.pptx VIP
- 部编本《一块奶酪》优质课公开课教案课堂教学实录.docx VIP
- DB13T 5448.3-2021 工业取水定额 第3部分:医药行业.docx VIP
- 山东省安装工程消耗量定额(2016).pdf
文档评论(0)