- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于位运算的频繁闭项集挖掘算法-计算机应用研究
第30卷第11期 计 算 机 应 用 研 究 Vol.30No.11
2013年11月 ApplicationResearchofComputers Nov.2013
一种基于位运算的频繁闭项集挖掘算法
徐嘉莉,杨洪军,赵茂娟,樊 云
(成都大学 电子信息工程学院,成都610106)
摘 要:针对相关算法在挖掘频繁闭项集时所存在的问题,提出了一种基于位运算的频繁闭项集挖掘算法。该
算法首先将数据集转换成布尔矩阵,只需扫描数据集一次;通过位运算计算支持度,利用矩阵和数组存储辅助信
息,减少时间和空间消耗;深度优先搜索产生频繁闭项集时利用剪枝策略进一步减少挖掘时间;利用同生项集性
质进行闭合性检测,无须检查超集或子集。理论分析和实验结果验证了该算法的有效性。
关键词:数据挖掘;频繁闭项集;矩阵;位运算;同生项集
中图分类号:TP311 文献标志码:A 文章编号:10013695(2013)11328003
doi:10.3969/j.issn.10013695.2013.11.018
Algorithmbasedonbitoperationforminingfrequentcloseditemsets
XUJiali,YANGHongjun,ZHAOMaojuan,FANYun
(SchoolofElectronic&InformationEngineering,ChengduUniversity,Chengdu610106,China)
Abstract:Aimingattheproblemsofminingfrequentcloseditemsets,thispaperproposedanalgorithmbasedonbitoperation
forminingfrequentcloseditemsets(MFCIS).Firstly,thealgorithmusedthevectortoexpressitemsindatabaseandscanedthe
databaseforonlyonetime.Secondlyitcomputedthesupportofitemsetsthroughthebitoperationandusedthematriceandthe
arraytostoretheancillaryinformationtoreducethetimeandmemeory,andusedpruningtechnologytoimprovetheminingeffi
ciencyduringcreatingthefrequentcloseditemsetsbydepthfirstsearch.Finally,itusedthenatureofsyngeneticitemsetsto
testfrequentcloseditemsetssoasnottotestsupersetorsubset.Theoreticalanalysisandexperimentalresultsshowthattheal
gorithmisefficient.
Keywords:datamining;frequentcloseditemsets;matrix;bitoperation;syngeneticitemsets
频繁项集挖掘是数据挖掘研究中的重要内容之一。根据 内存中保存并不断遍历结果集,当支持度较小、结果集较大时,
挖掘结果的不同,频繁项集挖掘可分为完全频繁项集挖掘、最 内存和时间的开销将会变得很大。
大频繁项集挖掘和频繁闭项集挖掘。 基于上述分析,本文提出了一种基于位运算的频繁闭项集
任何频繁项集的子集
您可能关注的文档
- 2003流行性感冒讲座-香港医学会.ppt
- 2004年回顾与2005年展望及工作重点-hongkongmonetaryauthority.ppt
- 200162公钥体系结构pki-read.ppt
- 2005年文学与信息技术国际研讨会–论文关于日本-二松学舍大学.pdf
- 2007-12职代会制度建设与基层民主发展.doc
- 2006年国际热带木材协定.pdf
- 2007-2第2351期-英语四级.doc
- 2007-2009年教育部哲学社会科学研究重大课题攻关项目课题.doc
- 2008年永康众泰汽车俱乐部草案-大迈x7.doc
- 2008年浙江长兴农村合作银行年报告摘要-德商村镇银行.doc
- 一种基于可信策略的云存储持久性检测方法-计算机应用研究.pdf
- 一种基于特征聚类的特征选择方法-计算机应用研究.pdf
- 一种基于隐私偏好的二次匿名位置隐私保护方法-山东大学学报理学版.pdf
- 一种对数据集稀疏度不敏感的协同推荐新方法-南京大学pasa大数据.pdf
- 一种改进的3g无线网络丢包模型及仿真方法-计算机工程与应用.pdf
- 一种改进的流程图相似度检索算法及实现-计算机应用研究.pdf
- 一种模糊概念相似度的计算方法-东北大学.pdf
- 一种用于科技项目查重的数据整合及描述模型-情报工程.pdf
- 一种离散随机petri网的性能计算和分析方法-东南大学学报.pdf
- 一种新的云存储数据容错存储方式检验方法new-电子与信息学报.pdf
文档评论(0)