关联规则的相关性研究.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关联规则的相关性研究.pdf

第2。卷第6期 德 州学 院学报 Vol.20,No.6 2004年 12月 JournalofDezhouUniversity Dec.2004 文章编号:1004一9444(2004)06一0051一04 关联规则的相关性研究 徐凤生 (德州学院计算机系,山东德州 253023) 摘 要:指出了支持— 可信度框架理论存在的不足:有些规则即使支持度、可信度都很高,但仍然没有 实际意义;关联规则X=Y本身没有给用户提供X对Y是起积极作用还是起抑制作用等信息.引人关联规则 的相关度及相关规则概念来克服这种不足,同时指出,相关规则不仅给用户提供了更多信息.而且避免了一些 无意义规则的产生. 关键词:知识发现;数据挖掘;相关度;相关规则 中图分类号:TP311文献标识码:A 知识发现(KnowledgeDiscoveryinData- 是起积极作用还是起抑制作用等信息,所以容易 base,简称KDD)是近几年发展起来的一门新兴 产生误导.为了克服这种不足,引入了相关度及相 研究领域,它是数据库技术、人工智能、神经网络、 关规则的概念,同时指出:发现的相关规则不仅给 统计学、机器学习等多门学科相结合的产物.数据 用户提供了更多有用的信息,而且避免了一些无 挖掘是整个知识发现过程的核心技术和步骤,是 意义规则的产生. 从大量数据中挖掘出隐含的、事先未知的、有潜在 价值的知识和规则.这些规则蕴涵了数据库中一 1 支持— 可信度框架理论 些数据项之间的特定关系,揭示了一些有用的信 息.在数据挖掘中,关联规则的开采是一个重要的 假设1=lilIi2I...Iim}是由m个不同的项目 研究课题.关联规则是形如 “90%的客户在购买面 组成的集合,给定一个事务数据库D,D中的每一 包的同时购买牛奶”这样的规则,反映了购买面包 个事务T都是由I中的一些项 目组成的集合,即 的客户同时购买牛奶的趋势.这对于市场营销、经 TCI,T有一个唯一的标示符TID. 营决策等具有重要意义. 定义1 设X是 I的一个子集,如果满足X 关联规则的开采问题是由R.Agrawal等人 cT,则称事务T支持X. 在文献[1」中最先提出来的,目前已有多种挖掘算 定义2 设X是I的一个子集,X的支持度 法[U,2,31.这些算法都基于支持一可信度框架理 是指数据库D中支持X的记录数与总记录数之 论.虽然这些算法可以发现关联规则,但至少存在 比,记为P(X),也可理解为X在D中发生的概 以下不足:发现的有些规则是无意义的规则;由于 率.如果X的支持度大于用户指定的最小支持 规则本身没有给用户提供X的发生对Y的发生 度,则称X为频繁项目集. 收稿日期:2004-05-24 作者简介:徐凤生(1965一).男,山东聊城人,硕士,德州学院计算机系教授,主要从事数据挖掘、Rough集与数据 库技术方面的研究. 万方数据 德州学院学报(自然科学版) 第20卷 定义3 设XCI,YC:-I,且XnY=$.蕴涵式 假如最小支持度和可信度分别为 45%, X=Y的支持度是指数据库中同时支持X和Y 90%,通过计算可以得到以下两条规则 的记录数与总记录数之比,记为Sx-Y.也可理解 iz=i,,其支持度为500o,可信度为100Y. 为X和 、’同时发生的概率,则Sh。丫=P(XY) i}i,,其支持度为00%,可信度为100%.

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档