基于遗传算法的等价类提取方法地研究.pdfVIP

基于遗传算法的等价类提取方法地研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第34卷增刊 河北工业大学学报 2005年8月 V01.34增刊 JOURNALOFHEBEIUNIVERSITYOFTECHNOLOGY 2005 August 基于遗传算法的等价类提取方法的研究 贺小扬,赵艳,李红梅 (河北农业大学信息科学与技术学院,河北保定071001) 摘要:提出了一种基于遗传算法的等价类分析的算法.此算法采用有效的基于最近邻基因匹配的交叉算子,使得 交叉过程能够不断产生有意义的个体,保证了群体的多样性.同时将k均值算法和遗传算法相结合,提高了搜索 速度和分类的精确性. 关键词:遗传算法;等价类;k均值算法;最近邻算法 O 引言 等价类的抽取是知识发现中一种重要环节,能够从研究对象的特征数据中发掘出关联规则.等价类 问题在一定条件下可以看作是一个带约束的最优化问题,因此可以使用遗传算法进行解决等价类问题. 本问题的一般解决方法是按照某种等价类准则进行等价类,如给定一组模式样本,如何划分样本集,使 得基于类内差或类间差的某种等价类准则函数值达到最小. 本文主要从两个方面出发,一方面,结合具体等价类问题的实际情况,采用有效的基于最近邻基因 匹配的交叉算子,使得交叉过程能够不断产生有意义的个体,保证了群体的多样性.另一方面,将k均 值算法和遗传算法相结合,提高了搜索速度和分类的精确性. 1等价类遗传算法 1.1等价类遗传算法的数学描述 分c={G,G,…,G),满足: x=UCi 扣1 Cf≠咖 G=1,2,…,m) CjnG=≯(f,J=1,2,…,m;f≠力 并且使得类间差和类内差满足:Fc=类间差/(1+类内差)达到最大. 是所有类内距离的和,觚,乙)是第k类的样本到其等价类中心的距离.这里,烈Zf,乃)和觚,磊)均是 欧氏距离,即 d(Z,乃)=lIZf一乃|| 觚,乙)=IIx,一五|I 等价类准则函数就是使得类与类之间的距离尽量大,类内距离尽量小,即使得R达到最大. 1.2等价类遗传算法 1.2.1确定等价类数目 使用七均值算法,首先任选k个初始的的等价类中心,根据使每一类中的样品到该类的等价类中心 的距离的平方和最小,进行迭代分类,将全部样品分配到k个类中,依此算法来进行确定初始的等价类 收稿日期:2005.06—12 作者简介:贺小扬(1971),男(汉族),讲师、硕士 增刊 贺小扬,等:基于遗传算法的等价类提取方法的研究 49 数目. 1.2.2编码与适应度的选择 为了将遗传算法应用于等价类分析,首先必须对每个可行解进行编码,从而将解空间变换为染色体 空间;并定义染色体的适应度,使得较优的个体适应度也较高.然后再对种群施加选择、交叉、变异等 的操作,使得群体不断向着最优解的方向进化. 在等价类遗传算法中,由于等价类问题的样本数目n一般远大于其等价类数目m,因此采用的染 色体的编码方式是基于等价类中心的十进制数编码.在这种编码方式下,一条染色体有m个等价类中 心组成,即s=ZlZ2…乙,由于样本的向量维数为d,因此一条染色体即为长度为m×d的十进制数的串. 当等价类中心确定时,等价类的划分根据最近邻法则决定,对于某个体S按照以下方法计算其适 应度: 1)按照最近邻原则,确定对应该染色体的等价类划分; 2)根据等价类划分,按照R=类间差/(1+类内差)来计算R. 依照此方法,个体的适应度与其对应的等价类划分相关,E的值越大,个体越优. 3)种群的初始化 种群是这样形成的,先将每个样本随机指派为某一类,作为最初的等价类划分,并计算各类的等价 类中心,一般根据下式进行计算:

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档