- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种双向关联规则提取算法
摘要:针对互为“前件”和“后件”的单向关联规则中发现的有趣现象,提出双向关联规则的概念,对“置信度”进行了重新的定义和分类,并在分析的基础上,提出一种双向关联规则的挖掘算法。
关键词:双向关联规则;左置信度;右置信度;强双向关联规则;强弱双向关联规则;频繁项集
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2009)05-1204-03
A Extraction Algorithm of Two-way Association Rules
YUAN Cai-hong, ZHANG Lian-tang
(Computer and Information Engineering College of Henan University, Kaifeng 475004, China)
Abstract: Against the interesting phenomenon found in the one-way association rules in which ones ‘before the rule is others after the rule, it put forward the concept of two-way association rules and confidence to be carried out a re-definition and classification. And based on analysis, a two-way algorithm for mining association rules is put forword.
Key words: two-way association rules ;left confidence; right confidence; strong two-way association rules; strong-weak two-way association rules; frequent item sets
1 引言
关联规则最早是由Agrawal等人提出的[1],最初提出的动机是针对购物篮分析问题提出的,其目的是为了发现交易数据库中不同商品之间的联系规则,这些规则可以用来指导商家科学地安排进货、库存及货架设计等。关联规则是形如X→Y的蕴含表达式,其中X和Y是不相交的项集[2]。
传统关联规则挖掘是单向的[3],在这些单向规则中我们发现一些有趣的规则,比如:“牛奶→面包(sup=75%,conf=91%)”和“面包→牛奶(sup=75%,conf=95%)”,两个规则都具有较高的支持度和置信度,说明两者总同时出现;现有的关联规则提取算法会把低置信度的规则滤掉,原因是认为它对决策者提取的信息意义不大,但是,如在电脑器材销售数据库上的两条规则:“个人电脑→U盘(sup=67%,conf=95%)”和“U盘→个人电脑(sup=67%,conf=10%)”,其中第一个规则具有较高置信度,而后面的规则支持度较低,说明个人电脑的销售,对于U盘具有促销作用,而大多购买U盘的人不会购买个人电脑,这样一对关联规则对商家来说,也是非常有意义的。本文提出一种双向关联规则提取算法,以挖掘那些在某些领域会更有意义的规则。
2 基本定义和定理
在后面介绍过程中,会用到的定义和定理如下:
定义2.1 双向关联规则:设D为事务数据库,I是D上的项目集,称“U?圮V”为双向关联规则,其中,U?奂I,V?奂I,并且U∩V=∮。其中,U、V称为规则的左部和右部,两者互称为规则的“前件”和“后件”。
性质2.1 双向关联规则U?圮V等价于V?圮U。
证明:根据双向关联规则定义可证。
定义2.2 左置信度、右置信度:设“U?圮V”为双向关联规则,左置信度confidence(U)=support(U∪V)/support(U),右置信度confidence(V)=support(U∪V)/support(V)。
定义2.3 高最小置信度h_min_conf、低最大置信度l_max_conf:为双向关联规则定义的两个参数,认为大于高最小置信度或低于低最大置信度是有意义的,通常h_min_confl_max_conf。
定义2.4强双向关联规则:设D为事务数据库,称“U?圮V”为D上的强双向关联规则,当且仅当左置信度confidence(U)≥h_min_conf,并且右置信度confidence(V)≥h_min_conf。
定义2.5 强弱双向关联规则:设D为事务数据库,称“U?圮V
文档评论(0)