- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第34卷增刊 河北工业大学学报 2005年8月
V01.34增刊 JOURNALOFHEBEIUNIVERSITYOFTECHNOLOGY 2005
August
基于遗传算法的等价类提取方法的研究
贺小扬,赵艳,李红梅
(河北农业大学信息科学与技术学院,河北保定071001)
摘要:提出了一种基于遗传算法的等价类分析的算法.此算法采用有效的基于最近邻基因匹配的交叉算子,使得
交叉过程能够不断产生有意义的个体,保证了群体的多样性.同时将k均值算法和遗传算法相结合,提高了搜索
速度和分类的精确性.
关键词:遗传算法;等价类;k均值算法;最近邻算法
O 引言
等价类的抽取是知识发现中一种重要环节,能够从研究对象的特征数据中发掘出关联规则.等价类
问题在一定条件下可以看作是一个带约束的最优化问题,因此可以使用遗传算法进行解决等价类问题.
本问题的一般解决方法是按照某种等价类准则进行等价类,如给定一组模式样本,如何划分样本集,使
得基于类内差或类间差的某种等价类准则函数值达到最小.
本文主要从两个方面出发,一方面,结合具体等价类问题的实际情况,采用有效的基于最近邻基因
匹配的交叉算子,使得交叉过程能够不断产生有意义的个体,保证了群体的多样性.另一方面,将k均
值算法和遗传算法相结合,提高了搜索速度和分类的精确性.
1等价类遗传算法
1.1等价类遗传算法的数学描述
分c={G,G,…,G),满足:
x=UCi
扣1
Cf≠咖 G=1,2,…,m)
CjnG=≯(f,J=1,2,…,m;f≠力
并且使得类间差和类内差满足:Fc=类间差/(1+类内差)达到最大.
是所有类内距离的和,觚,乙)是第k类的样本到其等价类中心的距离.这里,烈Zf,乃)和觚,磊)均是
欧氏距离,即
d(Z,乃)=lIZf一乃||
觚,乙)=IIx,一五|I
等价类准则函数就是使得类与类之间的距离尽量大,类内距离尽量小,即使得R达到最大.
1.2等价类遗传算法
1.2.1确定等价类数目
使用七均值算法,首先任选k个初始的的等价类中心,根据使每一类中的样品到该类的等价类中心
的距离的平方和最小,进行迭代分类,将全部样品分配到k个类中,依此算法来进行确定初始的等价类
收稿日期:2005.06—12
作者简介:贺小扬(1971),男(汉族),讲师、硕士
增刊 贺小扬,等:基于遗传算法的等价类提取方法的研究 49
数目.
1.2.2编码与适应度的选择
为了将遗传算法应用于等价类分析,首先必须对每个可行解进行编码,从而将解空间变换为染色体
空间;并定义染色体的适应度,使得较优的个体适应度也较高.然后再对种群施加选择、交叉、变异等
的操作,使得群体不断向着最优解的方向进化.
在等价类遗传算法中,由于等价类问题的样本数目n一般远大于其等价类数目m,因此采用的染
色体的编码方式是基于等价类中心的十进制数编码.在这种编码方式下,一条染色体有m个等价类中
心组成,即s=ZlZ2…乙,由于样本的向量维数为d,因此一条染色体即为长度为m×d的十进制数的串.
当等价类中心确定时,等价类的划分根据最近邻法则决定,对于某个体S按照以下方法计算其适
应度:
1)按照最近邻原则,确定对应该染色体的等价类划分;
2)根据等价类划分,按照R=类间差/(1+类内差)来计算R.
依照此方法,个体的适应度与其对应的等价类划分相关,E的值越大,个体越优.
3)种群的初始化
种群是这样形成的,先将每个样本随机指派为某一类,作为最初的等价类划分,并计算各类的等价
类中心,一般根据下式进行计算:
您可能关注的文档
- 甲砜霉素氯乙酸酯Delepine反应地研究.pdf
- Mn掺杂BaTi4O9微波介质陶瓷的远红外光谱探究.pdf
- LC%2fMS%2fMS法应用于蜂王浆中氯霉素残留检测探究.pdf
- Ad+hoc无线网络中的拥塞控制探究.pdf
- 减速顶测试系统中关键技术的研究与应用.pdf
- 骨质疏松股骨颈骨折皮质骨改变.pdf
- 基于HCV+6Kb扩增子的动态准种优势株的确定与包膜2基因正选择位点分析.pdf
- 电厂输煤系统地研究.pdf
- 歼七系列飞机框缘螺栓防断裂探究.pdf
- Winkler地基板无单元法权函数探究.pdf
- 建设工程质量安全管理标准化图集(安全篇2024版)ppt230页.pptx
- 《油气储存企业安全风险评估细则(2025年修订)》解读.pptx
- 2025年《危大工程专项施工方案严重缺陷清单专题培训》ppt120页_1230.pptx
- 中建分部分项检验批划分方案、资料目录策划编制要点ppt75页.pptx
- 某项目智慧工地示范项目应用成果介绍75页_5843.pptx
- 2025年中国风筝无人机LED夜光编队编程师应聘面试模拟题及答案.doc
- 2025年中国鞍钢集团招聘笔试题库附答案.doc
- 2025年中国鞍钢集团招聘面试预测题及答案.doc
- 临床器械实验培训试题及答案2025年版.docx
- 中石化《两个责任》解读分析.ppt
文档评论(0)