联系规则候选项频度规律研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机科学2003V.1.30N0.10(增刊) 关联规则候选项频度规律研究 RegularitiesonSupportCountsofAssociationalCandidateGenerations 周焕银 张 永 (兰州理工大学电气工程与信息工程学院 兰州730050) Abstract Aprion isfamousforitspredictioncandidatesforassociationalrulesmining,butwithtransaction databasebecomingmoreandmorelarge,thenumberofitscandidatesincreasesatexponentialspeed.Whiletheuse- fulcandidatestointerestingassociationalrulesaresosmallthatalotoftimeiswastedincheckingthoseuseless candidates.Toovercomethisquestionthreerulesareconcluded.Benefitingfromtheserulesthealgorithmcan cientlycontroluselesscandidatesresultingandexactlypredictlargeitemsets.Atthesametimeweintroduceroefdfei pendentsupportcounttoavoidlosinganyinterestingassociationalruleduringpruning. KeywordsIndependentsupportcount.Depletionofrulesupportcount.Constantonfixitemsupportcount 度阑值与数据集D中的记录数乘积。 1 引言 频繁项集:支持频度大于等于最小支持频度阂 著名的Apriori算法是关联规则挖掘算法中应 值的项集。 用最广泛的一种。它利用频繁项集的向上封闭性产 父须繁项集(fatherlargeitemsets):如果k一项 生候选项,但随着数据库规模的扩大由此算法产生 集(含有k个项的项集)是频繁项集,那么它就是所 的候选项的数量是无法估计的,而频繁项集的候选 有构成它的子频繁项集的父频繁项集。 项所占比例甚少,故如何准确有效地避免无用侯选 挽则须度损耗:随着关联规则规模的扩大它的 项集产生是问题的关键。本文通过对父子频繁项集 频度不会增加的性质,称为关联规则频度损耗。 频度研究总结出了三条规律来实现对候选项频度提 固定项集频度宁恒性:某一固定项集的频度不 前预测,从而大大减少了无用候选项的产生。同时本 会因发现与它相关的规则而减少它的频度,即祖辈 文引人了独立频度,通过各项频度与其独立频度差 项集不会影响它的子孙辈频度。 值作为阐值的比较频度,来准确删除无用候选项集。 项集的独立性:如果某一k一项集的频度为n,它 的某一k-1子项集的频度为m,则有m)n,那么就 2 父子频繁项频度规律研究及其说明 有m-n频度的项集未对此k一项集的连接做出贡 关联规则的属性一般可分为两个重要参数川 献,就称这m一n个k一1项集独立于此k一项集,此k 可信度(confidence)、支持度(support)。可信度是对 一1项集的独立频度(Sic)为m-n, 关联规则准确度的衡量,支持度是对关联规则重要 2.2 父子项集间频度规律 性的衡量。支持度说明了所发现关联规则在所有数 通过对Apriori算法中的父子频繁项集间频度 据信息中的

文档评论(0)

精品教学资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档