一种改进的基于关联规则挖掘的遗传算法.docVIP

一种改进的基于关联规则挖掘的遗传算法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进的基于关联规则挖掘的遗传算法   摘要:针对传统的遗传算法容易导致算法的过早收敛而陷于局部最优困境,或收敛时间过长而消耗大量的搜索时间的缺陷,该文提出了一种改进的遗传算法,该算法采用一种自适应变异率和改进的个体选择方法,并且将这种改进遗传算法应用于关联规则的挖掘,实验结果证明这种算法是有效的。   关键词:数据挖掘;遗传算法;关联规则   中图分类号:TP18文献标识码:A文章编号:1009-3044(2008)35-2504-03   A Kind of Improved Genetic Algorithm Based on Association Rules Mining   LAI Wan-qin, LEI Xiao-zhen   (Fujian Communications Technology College, FuZhou 350007, China)   Abstract: To the traditional genetic algorithm easily lead to premature convergence of the algorithm and into the plight of local optimum, or Convergence too much time and consume a large amount of time to search for flaws,this text proposed a kind of improved genetic algorithm, The algorithm adopts an adaptive mutation rate and improve the methods of individual choice, and this will improve the genetic algorithm used in the data mining association rules. The experimental results show that the efficiency of the algorithm for database.   Key words: data mining; genetic algorithm; association rule      1 引言      遗传算法是一种基于生物进化论和分子遗传学的全局随机搜索算法,具有很强的随机性、鲁棒性和隐含并行性,能快速、有效地进行全局优化搜索,是处理大规模数据项目集的有效方法。目前基于遗传算法的数据挖掘方法有了一定的进展,基于遗传算法的关联规则研究也取得了一些成果。但是,传统的遗传算法存在一定的缺陷,容易导致算法的过早收敛而陷于局部最优困境,或收敛时间过长而消耗大量的搜索时间。因此,本文提出了一种改进的遗传算法,该算法采用一种自适应变异率和改进的个体选择方法,用来克服上述问题,并且将这种改进遗传算法应用于关联规则的挖掘。      2 遗传算法原理      遗传算法(GeneticA lgorithms,GAs),是模拟生物在自然环境中遗传和进化过程而形成的一种自适应全局优化概率搜索算法。他在解决大空间、多峰值、非线性、全局优化等高复杂度问题时显示了独特的优势[1]。把待解决问题的参数编成二进制码或十进制码(也可编成其他进制码)即基因,若干基因组成一个染色体(个体),许多染色体进行类似于自然选择、配对交叉和变异的运算,经过多次重复迭代(即世代遗传)直至得到最后的优化结果[2]。使用遗传算法解决问题时涉及到以下七个主要因素[3]。   1) 编码   将待求解问题的解根据约束条件、选择合适的编码方法(比如二进制、整数、实数编码方法、格雷码编码、多参数级联编码、多参数交叉编码等),编码成通过位串表示的染色体。不同的编码,有不同的特点,使用时应根据需要选择[4]。   2) 适应度函数   遗传算法采用适应度这个概念度量群体中个体在优化算法计算中可能达到、接近于或有利于找到最优解的优良程度,适应度是遗传算法选择操作的惟一依据。   3) 选择算子   遗传算法中最重要的就是选择、交叉、变异这三个基本算子。选择算子一般采用轮盘赌选择,在这种选择算法中,每条染色体的适应度函数值占所有染色体适应度函数值总和的比例即为该染色体被选择的概率,根据这个概率,从原有的染色体中挑选出染色体放入交配池中,新的染色体可以有重复。   4) 交叉算子   交叉是指每对染色体选择一个随机位置,其后的二进制串进行交换即可。常见的交叉方法有单点交叉、多点交叉等等,一般采用单点交叉。   5) 变异算子   变异算子有利于增加群体多样性

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档