- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5.3.3改进算法的时间复杂性分析 Apriori算法的时间复杂性为 。 一般来说, ,而p作为被删除的列,k作为强项集的长度。对改进后的关联规则算法的时间复杂度的分析: (1)在最坏的情况下,当p=k时,有: (2)当kp或者kp(属于一般的情况)时,满足: 因此,共节省时间是 {一般地说,kp} 。 5.3.3改进算法的时间复杂性分析 在解决以上三个主要研究问题后,总结改进的Apriori方法的计算步骤,快速产生强关联属性的关联规则方法总体流程为: 1. 将DBS问题转换成抽象的DBS:将数据库中的数量相关的问题转换成逻辑相关的问题。按照决策问题要求,将数据库中的各个属性转换成多维逻辑属性。 2. 求强项集:该问题可以分解为两个子问题:(1)求出D中满足最小支持度min_sup的所有强项集;(2)利用强项集生成满足最小可信度min_conf的所有关联规则。 3. 将抽象的DBS问题转换成DBS,表达关联规则。 5.3.3改进算法的时间复杂性分析 对步骤2的子问题(1)的求解是知识发现的关键部分。具体方案描述如下: 由候选1-项集的集合C1,产生强1-项集合L1,对于在数据库中出现次数比min_sup计数少的属性列进行逻辑标记,在以后的各次扫描中跳过这些属性; 5.3.3改进算法的时间复杂性分析 求k项集,令k=1; 由Lk产生候选(k+1)-项集的集合Ck+1;根据min_sup,由候选(k+1)-项集的集合Ck+1产生(k+1)-强项集的集合Lk+1,当执行到第i行,若该行的项集长度小于(k+1),则对该行做出逻辑标记,在以后的各次扫描中,都可以跳过该行,不再扫描; 若该行的项集长度等于(k+1),确定该行项集的模式,与候选项集中的模式进行匹配,匹配成功则该项集的支持度计数器+1,对候选项集中的其他模式,在本行中不再扫描;匹配不成功则跳过本行; 若该行的长度大于(k+1),将此行中与候选k+1项集模式相匹配的项集支持度计数器+1,将候选集Ck+1中所有项集的支持度与min-sup进行比较,产生Lk+1。 5.3.3改进算法的时间复杂性分析 快速产生强关联属性的关联规则方法总体流程图 5.5 小结 关联规则是数据挖掘的重要方法之一,用来得到有价值的规则。本章重点介绍了的主要内容是: 关联规则的定义与解释; 关联规则在知识管理过程中的应用; 关联规则算法; 关联规则算法流程。 提出了一种Apriori算法的改进方法,最后给出了Apriori算法的具体计算过程。 本章内容结束! 辽宁省物流航运管理系统工程重点实验室 数据挖掘技术与应用 陈燕教授 第5章 关联规则模型及应用 大连海事大学 本章提纲 关联规则的基础理论 5.1 Apriori关联规则算法 5.2 改进的Apriori关联规则方法 5.3 Apriori关联规则方法的实例 5.4 小结 5.5 5.1关联规则的基础理论 5.1.1 关联规则的定义与解释 5.1.2 关联规则在知识管理过程中的作用 5.1.1 关联规则的定义与解释 关联规则(Association Rules)是指在大型的数据库系统中,迅速找出各事物之间潜在的、有价值的关联,用规则表示出来,经过推理、积累形成知识后,得出重要的相关联的结论,从而为当前市场经济提供准确的决策手段。 关联规则的应用已经比较广泛,如条形码的应用已使大型零售商品的组织问题成为现实,从决策领域到通讯报警系统的应用,以及诊断和预测等相关领域。 5.1.1 关联规则的定义与解释 关联规则的研究和应用是数据挖掘中最活跃和比较深入的分支,目前,已经提出了许多关联规则挖掘的理论和算法。最为著名的是R.Agrawal等提出的Apriori及其改进算法。 为了发现有意义的关联规则,需要给定两个阈值:最小支持度(Minimum Support)和最小可信度(Minimum Confidence)。 5.1.1 关联规则的定义与解释 挖掘出的关联规则必须满足用户规定的最小支持度,它表示了一组项目关联在一起需要满足的最低联系程度。 挖掘出的关联规则也必须满足用户规定的最小可信度,它反映了一个关联规则的最低可靠度。 在这个意义上,数据挖掘系统的目的就是从数据库中挖掘出满足最小支持度和最小可信度的关联规则。 5.1.2 关联规则在知识管理过程中的作用 知识管理是一个过程,通过这一过程可以学习新知识和获得新经验,并将这些新知识和新经验反映出来,进行共享,以用来促进、增强个人的知识和机
您可能关注的文档
最近下载
- 兴边富民工程实施方案(3篇).docx
- 苏科版八年级数学上册压轴题攻略专题03解题技巧专题:判定三角形全等的基本思路压轴题三种模型全攻略(原卷版+解析).docx VIP
- 卡通手绘风班干部竞选自我介绍PPT模板(二零二五学期版).pptx VIP
- 带锯机安全生产操作规程.pptx
- 第3课 古代印度 课件(共34张PPT).pptx VIP
- 公共政策3政策的资料搜集与方法剖析.ppt VIP
- 专题04 解题技巧专题:判定三角形全等的基本思路压轴题三种模型全攻略(解析版).docx VIP
- 2025年健康管理师技能证书全国考试题库(含答案).pdf VIP
- 写景抒情散文阅读.doc VIP
- 中小学班级卫生值日表 模板.docx VIP
文档评论(0)