第ZS眷第4期-计算机应用.PDF

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第ZS眷第4期-计算机应用

第25卷第4期 计算机应用 Vol_25 No.4 2005年4月 Computer Applications Apr.2005 文章编号:1001—9081(2005)O4—0805—03 一 种基于概率的加权关联规则挖掘算法 尹 群,王丽珍,田启明 (云南大学信息学院,云南昆明650091) (yinq@nb.spdb.con.cn) 摘 要:针对关联规则数据挖掘在实际应用中出现的问题:不能挖掘小概率事件中的关联规则。 提出了基于概率分布的加权关联规则挖掘算法。该算法同时改进了加权支持度计算方法,保持 Apriori算法的频繁集向下封闭的特性,并在实践中得到了有效的应用。 关键词:加权关联规则;概率分布;加权支持度 中图分类号:TP311.131 文献标识码:A Algorithm of mining association rules with weighted items based on probability YIN Qun,WANG Li—zhen,TIAN Qi-ming (College ofInformation,Yunnan Kunming Yunnan 650091,China) Abstract:A algorithm of mining association rules with weighted items base on probabifity Was designed,it solved the problem of the classical Apriori algorithm which can’t mine association rules in the little probability items.At the sallle time the problem of invalidation of the”downward closure property”in the weighted setting Was solved by using an improved model of weighted suppo~measurements.The algorithm is both scalable and efficient in discovering relationships in practical using. Key words:weighted association rule;probability distributing;weighted support 得非常低(1.8%),否则无法挖掘出相关的规则,但如果支 0 引言 持度的阈值设得非常低,则同时会导致无用规则的大量出现, 数据挖掘又称数据库中的知识发现,关联规则的挖掘是 并使算法的挖掘效率降低。针对这种情况,我们提出了基于 其中一个重要的分支。文献[1]首先提出了挖掘顾客交易数 概率分布的加权关联规则挖掘算法,以解决此问题。 据库中项集间的关联规则,并提出了经典的Apriori算法。 1 基于概率的加权关联规则 关联规则的定义:设,={i ,i ,…,i }是二进制文字的 集合,其中的元素称为项(Item)。记D为交易(Transaction)T 经典的Apriori算法是一个基于两阶段频集思想的方法, 的集合,这里交易 是项的集合,并且 ,。对应每一个交易 将关联规则挖掘算法的设计分解为两个子问题:1)找到所有 有唯一的标识,如交易号,记作TID。设 是一

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档