- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于概念格的规则提取算法研究及改进.pdf
第28卷第2期 科技通报 V01.28No.2 2012年2月 BULLETINOFSCIENCEANDTECHNOLOGY Feb.2012 基于概念格的规则提取算法研究及改进 赵 凯 淄博职业学院,山东淄博255314 摘要:提出了一个基于概念格的规则算法的改进算法。该算法可以大大提高数据挖掘的效率,提高查 找时的速度。 关键词:数据挖掘;概念格;算法 中图分类号:TP399 文献标识码:A 文章编号:1001—71 19 2012 02—0123—03 LatticebasedRuleExtraction Researchand Concept Algorithm Improvement zHAOKa/ Vocational 2553 Zibo Institute,Zibo14,China Abstract:This arolesbasedon lattice to the can paperpresents concept algorithm improvealgorithm,thisalgorithm the ofdata thesearch greatlyimproveefficiencymining,improvespeed. words:data lattice Key mining;concept
1 关联规则挖掘 算法对每个规则的支持度和信任度不能很好地支持. 只支持满足本身支持度和信任度的相关规则。 关联规则挖掘就是从数据库中挖掘出所有的强关 2.2算法的描述
联规则和数据。它可以分为以下几个问题: S是一个规则集合,F Xi是闭合集合S中的大部分 1 在事务数据库中找出所有的相关频繁数据项 规则闭合子集中的集合。 目集。即找出用户指定的最小关联频繁数据项,而且要 MaYjmalOenerators Y,S ;
不小于指定的项目集。 Omax Y dp; //集合X中的新项目集 2 在事务数据库找出的频繁数据项目集,经过 J Y-Yj; Forall
一系列动作,产生相关的强关联规则。 j EJ,,每一个子集项目作为最大生成器 OI毗m O—mu jl;
2算法改进 o, jijEY-Jl;//剩余的项目集 t l;
2.1算法的提出 WhileOT≠巾 FORALL0E0T 新的算法相对以前的规则产生集来说,大大减少 JF FOR
了规模,并且大大提高了相应的数据挖掘的效率。为了 O荜Yj ALLYjES
和以前的传统规则的产生集相区别,我们把这个新的 O~ Y 0“ Y u 01.
产生集称为组规则产生集。它和传统的提取规则算法 Ot Ot—O; .,/做为下一轮的候选最大生成器
相比,由于产生集的规模大大减少了,由此,用户可以 Ot,t O’-j1…Jd”tlVljt+l。30iE
很好地理解相应的规则,更容易推导出其他的新规则, 0t,oj_jI..·jj-ljj.t··“l
避免了大量的对用户来说无用的新规则的产生,对于 t t+l;
大型的数据库来说.也避免了产生大量的规则产生集。 创建一个新的概念格,从中取出相应的规则。设定
但是该算法相对传统规则集来说也有不足,比如新的 支持度的最小值为A。信任度的最小值为B。 收稿日期:201I-10-26 作者简介:赵凯 1981- .硕士.助教,研究方向:网络数据库。 124 科技通报 第28卷 通过取出的规则,创建一个规则的最小集合C。 因为nuiil A2+A 步骤一:初始化C 0。根据获取的规则数计算求出
所需要的事务节点总数D,把事务节点总数D n+l,并是不一样的。因此由A mintedon Bn +C
且把事务节点数存储在创建的最小集合H中。 步骤二:经过计算,求出H中所有的根节点和子节
点的上级和下级节点中的指针数,然后求出最小指针
数Fmin和最大指针数Fmax。 i n 以及其他的组节点之间的规则都可以由上面的证 步骤三:如果Fmin--0,此计算直接结束,转到最后明来推导出来。通过对所有组节点的理论证明,我们都
一步。否则,把Fmax中的数值放入到最小集合H中。 可以推导出来相应的组节点规则。 经过计算求出子节点D的外延指数,白定义为q。 3.2实例描述 根据子节点D的外延指数,直接求出相应的上级 把信任度设置为40%,支持度设置为5,创建一个
和下级节点的数量,然后存储在最小集合H中。 根据规则生成一个产生集合相应的节点K和Kn,
他们之间的支持度和信任度都设置为最小,放入集合 索计算,根据算法可以产生一个规则集,如下:
H中。 1 4~6之间的节点信任度可以为20%,支持度为5; 对于节点K和Kn,去掉相应的上级和下级的外
您可能关注的文档
最近下载
- 论文写作与学术规范答案_论文写作与学术规范答案资源.doc VIP
- QCSG-GXPG2084037-2021 分布式光伏并网服务业务指导书.docx VIP
- 宁海博物馆红妆馆设计说明(扩初).doc VIP
- 4.2依法履行义务课件 -2024-2025学年统编版道德与法治八年级下册.pptx VIP
- 2025年国开行政法与行政诉讼法形考任务2试题及答案 .pdf VIP
- 2024-2025学年甘肃省小升初数学试卷及解答参考.pdf VIP
- 工业产品主数据标准通用规范.pdf VIP
- 三龄两历一身份认定表填写标准规范及样表.doc VIP
- 试油气操作规程 课件.ppt VIP
- 5《大学物理学》静电场练习题(马).doc VIP
文档评论(0)