- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于遗传算法数据挖掘新方法
一种基于遗传算法的数据挖掘新方法
【摘要】:文章首先对相关理论进行了概述,阐明了数据挖掘和遗传算法的产生与发展以及他们的相互结合,接着提出了BP神经网络的原理及其不足之处。然后提出了一种遗传算法和BP神经网络相结合的算法,并讨论了该遗传算法的编码方法、遗传算子的设计和适应度函数的构造,并把算法运用在数据挖掘技术中。
【关键词】: 数据挖掘; BP神经网络; 遗传算法; 遗传BP神经网络
中图分类号:TP 文献标识码:B 文章编号:1002-6908(2007)0910045-02
1.引言
随着社会信息化的不断推进、数据库技术的不断发展以及大规模的数据仓库的建立,数据库、数据仓库中存储的信息量急剧增大,能从这些海量的数据中找出背后有用的信息,解决数据过多造成的不缺数据缺知识的信息爆炸问题,就需要用到数据挖掘技术。
然而在各种数据挖掘工具中,都有其自身算法的局限性,都存在着一定的不足。而遗传算法是基于生物进化原理的一种具有鲁棒性的自适应优化方法。将数据挖掘方法与遗传算法相结合,可以使他们更有效的发挥各自的特点,弥补彼此的不足,并把这种算法运用在数据挖掘系统中能够解决数据挖掘技术中出现的问题。
2.概述
2.1 数据挖掘的产生与发展
数据挖掘(Data Mining)研究是计算机科学与技术,特别是计算机网络的发展与普遍使用所提出的、迫切需要解决的重要课题。事实上,在计算机科学,特别是人工智能的研究中,类似的研究已开展多年。机器学习与知识发现(Knowledge Discovery, KD)一直是人工智能研究者关心的重要问题,尽管Data Mining与KDD根据当前的可能应用提出了新的需求,但是,他的研究进程保留着大量机器学习与知识发现研究的痕迹。就理论与方法而言,属于他自身的还是太少了。多种理论与方法的合理整合是大多数研究者采用的有效技术。从20世纪80年代开始,在世界各地逐渐形成了一批Data Mining和KDD的研究小组。最近,商品化的KDD软件工具已开始进入市场,如IBM的Intelligent Data Miner (IDM)和SGI的Mine Set等。
2.2 遗传算法的产生与发展
遗传算法(Genetic algorithm, 简称GA)是一种借鉴生物界自然选择和自然遗传机制的高度并行、随机、自适应搜索算法[1]。它能在复杂而庞大的搜索空间中自适应地搜索,寻找出最优或准最优解,且有算法简单、适用、鲁棒性强等优点。
早在20世纪60年代初,美国Michigan大学的J.H. Holland教授提出了第一个进化计算模型-遗传算法(Genetic Algorithms, GA)。1975年出版了他的专著《自然与人工系统中的自适应》( Adaptation in Natural and Artificial Systems ),标志着遗传算法的正式诞生。遗传与算法的结合体现了生物科学与计算机科学的相互渗透及融合。遗传算法产生后,在20世纪80年代以前,并没有引起人们的关注,一方面是因为他本身还不成熟,另一方面则是当时的计算机容量小,计算速度慢,使得需要较大计算量的遗传算法难以实际应用。进入80年代,遗传算法迎来了兴盛发展时期,无论是理论还是应用都成了研究热点。尤其是应用研究显得格外活跃,给遗传算法注入了新的活力。
2.3 遗传算法与数据挖掘
遗传算法是数据挖掘的主要算法之一。数据挖掘的研究大致可分为3大领域:数据收集和预处理、挖掘、评价和知识呈现。数据收集和预处理领域主要研究数据库和数据仓库。数据仓库就是为某一挖掘主题而汇集的数据集。挖掘领域主要是对各种算法的研究,是目前KDD研究最多的地方。评价和知识呈现领域主要研究人机界面、可视化问题等。
由此可见数据挖掘技术是一门多学科的综合技术,涉及到人工智能、数据库、机器学习等众多领域的知识。其中如何从大型数据库中提取人们感兴趣的知识是数据挖掘的一个重要方面。研究如何将遗传算法较好地应用到数据挖掘中是文章的目的。文章将遗传算法应用到神经网络中,从而克服神经网络的缺陷,更有效地就行数据挖掘。
3.遗传BP神经网络的设计及在数据挖掘中的应用
BP神经网络(Back-Propagation neural network)是目前应用最广泛的一种神经网络学习算法,具有理论依据坚实,推导过程严谨,物理概念清晰及通用性好等优点。但是,BP算法同时存在收敛速度慢,有可能陷入局部最小,以及网络参数(如中间层神经元的个数)和训练参数(如学习率、误差阈值等)难以确定等缺点[2-4]。
3.1 标准
您可能关注的文档
最近下载
- 中国专利奖申报书.docx VIP
- 约翰克兰John Crane SE系列 培训指南.pdf VIP
- 结构化面试护士50道面试题附答案.docx VIP
- 山东省三级老年病医院基本标准(2023).docx VIP
- 统编版小学三年级上册语文精品课件 司马光.ppt VIP
- ancient-chinese-philosophy中国古代哲学.ppt VIP
- 4.3海-气相互作用课件 高中地理人教版(2019)选择性必修一.pptx VIP
- 砂土地基钢板桩施工振动锤选型及应用-华北交通工程.pdf
- 10SG614-2 砌体填充墙构造详图(二)(与主体结构柔性连接).pdf VIP
- 超声检测技术.ppt VIP
文档评论(0)