- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机科学2003V.1.30N0.10(增刊)
关联规则候选项频度规律研究
RegularitiesonSupportCountsofAssociationalCandidateGenerations
周焕银 张 永
(兰州理工大学电气工程与信息工程学院 兰州730050)
Abstract Aprion isfamousforitspredictioncandidatesforassociationalrulesmining,butwithtransaction
databasebecomingmoreandmorelarge,thenumberofitscandidatesincreasesatexponentialspeed.Whiletheuse-
fulcandidatestointerestingassociationalrulesaresosmallthatalotoftimeiswastedincheckingthoseuseless
candidates.Toovercomethisquestionthreerulesareconcluded.Benefitingfromtheserulesthealgorithmcan
cientlycontroluselesscandidatesresultingandexactlypredictlargeitemsets.Atthesametimeweintroduceroefdfei
pendentsupportcounttoavoidlosinganyinterestingassociationalruleduringpruning.
KeywordsIndependentsupportcount.Depletionofrulesupportcount.Constantonfixitemsupportcount
度阑值与数据集D中的记录数乘积。
1 引言 频繁项集:支持频度大于等于最小支持频度阂
著名的Apriori算法是关联规则挖掘算法中应 值的项集。
用最广泛的一种。它利用频繁项集的向上封闭性产 父须繁项集(fatherlargeitemsets):如果k一项
生候选项,但随着数据库规模的扩大由此算法产生 集(含有k个项的项集)是频繁项集,那么它就是所
的候选项的数量是无法估计的,而频繁项集的候选 有构成它的子频繁项集的父频繁项集。
项所占比例甚少,故如何准确有效地避免无用侯选 挽则须度损耗:随着关联规则规模的扩大它的
项集产生是问题的关键。本文通过对父子频繁项集 频度不会增加的性质,称为关联规则频度损耗。
频度研究总结出了三条规律来实现对候选项频度提 固定项集频度宁恒性:某一固定项集的频度不
前预测,从而大大减少了无用候选项的产生。同时本 会因发现与它相关的规则而减少它的频度,即祖辈
文引人了独立频度,通过各项频度与其独立频度差 项集不会影响它的子孙辈频度。
值作为阐值的比较频度,来准确删除无用候选项集。 项集的独立性:如果某一k一项集的频度为n,它
的某一k-1子项集的频度为m,则有m)n,那么就
2 父子频繁项频度规律研究及其说明 有m-n频度的项集未对此k一项集的连接做出贡
关联规则的属性一般可分为两个重要参数川 献,就称这m一n个k一1项集独立于此k一项集,此k
可信度(confidence)、支持度(support)。可信度是对 一1项集的独立频度(Sic)为m-n,
关联规则准确度的衡量,支持度是对关联规则重要 2.2 父子项集间频度规律
性的衡量。支持度说明了所发现关联规则在所有数 通过对Apriori算法中的父子频繁项集间频度
据信息中的
您可能关注的文档
最近下载
- 2025年数字化农场管理方案研究项目可行性研究报告.docx
- 幼儿园社会治安最小应急单元管理制度.docx VIP
- PPT《建筑电气与智能化通用规范》GB 55024-2022 解读(OCR).pdf VIP
- 2025下半年教师资格考试新版试卷真题附答案(高中信息技术).docx VIP
- 生理学基础第十章-神经系统.ppt VIP
- ABB ACS180 drives User interface guide 手册(英语)说明书.pdf
- 驳岸工程施工方案.pdf VIP
- 股权激励变成股权纠纷通用.pdf VIP
- 南芯产品规格书SC8886.pdf VIP
- 胃食管反流病中西医结合诊疗专家共识(2025年).pptx VIP
原创力文档


文档评论(0)