数据挖掘关联规则的改进算法SDA算法论文.pdfVIP

数据挖掘关联规则的改进算法SDA算法论文.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘关联规则的改进算法一sDA算法 ANew AssociationRule8 Algorithm AIgornhm—SDA 林明霞罗键 (厦门大学自动化系 厦门361005) the new isIntroduced.ThIs Abst阳ctOn basisof andDHP amlysis algorithm algo— Aprio“algorhhmalgorithm,a can these rithm the therecordsneedto d讧ferent improveefficiencybyreduci“g span.Atlast,compare algor“hms ar试makeacoI坨lusiontheresults. upon Data Kty帅rds minl。堰.Associationrnles,Algorithm 1引言 关联规则口々∽一4).sup印坩∽)/sup声州妇),即 近年来互联网的发展与快速普及,使得人们真 规则a{(A—a)的确信度。 正体会到了数据海洋无边无际。面对如此巨大的数 5经典的Apriori算法和DHP算法 据资源,人们迫切需要一种新技术以及高智能工具, 以便能够帮助人们在这浩瀚的海洋中寻找到有用的 信息资源,数据挖掘技术就应运而生了,而关联规则 最有影响的。算法基于这样的事实:算法使用频繁项 集性质的先验知识(利用一个层次顺序搜索和循环 是数据挖掘的核心技术,它是由R.Agrawal等人首 先提出的。关联规则算法的效率是算法优劣的关键。 方法来完成频繁项集和挖掘工作)。Aprio“使用一 种称作逐步搜索的迭代方法,k一项集用于探索(k+ 2关联规则挖掘的基本问题 1)一项集。 关联规则定义:设I一{i。,屯,…,i。}是所有项目 Apriori算法:首先遍历目标数据库一次(循环 的集体,D是所有事务的集合(即数据库),每个事务 1),记录每个项目或属性的出现次数,即计算每个项 T是~些项目的集合,T包含在I中,每个事务可以 目的支持度,收集所有支持度不低于用户最小支持 用唯~的标识符TID来标识。设x为某些项目的集度的项目构成频繁1一项目集L1,然后链接L,中所有 的元素对形成候选2一项目序列集c:,再次遍历事务 合。如果x量T则称事务T包含x.关联规则表示 数据库,计算C。中每个候选2一项目序列集的支持 为如下形式(xcT)x{y(yc丁)的蕴涵式,这里x 度,收集所有支持度不低予用户最小支持度构成频 cT中,ycT中并且xny一曲,事务集D中的规 繁2一项目序列榘L2,再链接Lz形成C,,遍历数据库 则x{Y式由支持度s(support)和确信度(confi_ 得k,反复执行以上过程,直到没有候选项目序

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档