- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第50卷 第5期 山 东 大 学 学 报 (理 学 版) 2015年5月
Vol.50 No.5 JournalofShandongUniversity(NaturalScience) May2015
文章编号:16719352(2015)05002307 DOI:106040/j.issn.1671935202014306
一种基于位表的有效频繁项集挖掘算法
赵官宝,刘云
(昆明理工大学信息工程与自动化学院,云南 昆明650500)
摘要:在数据挖掘技术中,关联规则挖掘的关键在于快速、准确地挖掘频繁项集。传统的Apriori类算法在挖掘频
繁项集时存在扫描整个事务数据库的次数较多、频繁项集挖掘时间较长的问题。基于位表提出了频繁项集挖掘
算法BITXOR,用二进制序列表示项集,通过异或运算判断两个项集是否能连接;在项集连接后,BITXOR算法对
初始候选项集进行剪枝操作。仿真结果表明,在相同条件下,与传统的Apriori、FPgrowth算法相比,BITXOR算法
仅需扫描整个事务数据库一次,频繁项集的挖掘时间明显减少,在密集型数据库条件下性能表现更加显著。
关键词:关联规则;频繁项集;位表;异或;剪枝
中图分类号:TP274 文献标志码:A
Anefficientbittablebasedfrequentitemsetsminingalgorithm
ZHAOGuanbao,LIUYun
(FacultyofInformationEngineeringandAutomation,KunmingUniversityofScienceandTechnology,
Kunming650500,Yunnan,China)
Abstract:Fastandaccurateminingfrequentitemsetisthekeyofminingassociationrulesindataminingtechniques.The
traditionalApriorilikealgorithmsneedtoscantheentiretransactiondatabasemanytimesandspendtoolongtimeformining
frequentitemsets.Basedontheefficientbittable,anbasedfrequentitemsetsminingalgorithmBITXORwasproposed,which
usesthebittableandrepresentsitemsetswithbinarysequence.BITXORjudgeswhethertwoitemscanbeconnectedbythe
sequenceofbinaryXOR.Aftertheconnectionofitemset,BITXORalsocarriesoutpruningoperationontheinitialcandidate
sets.Thesimulationresultsshow,comparedwiththetraditionalApriorialgorithmandFPgrowthalgorithmunderthesame
conditions,BITXORalgorithmscanstheentiretransactiondatabaseonlyonceandsignificantlyreducesthetimeofmining
frequentitemsets.TheperformancesofBITXORaremoresignificant
您可能关注的文档
- To:-嘉兴高是灭菌技术有限公司.DOC
- TP38系列浮动式叶轮轴封维修.PDF
- TPS2660x具有集成反相输入极性保护功能的60V2A工业-德州仪器.PDF
- TranscendTM在线净化LCMSMS系统分析茶叶基质中30种农药残留.PDF
- T健美运动与营养课件健美与营养.PPT
- UCAN学生手册-高苑研发处制.PPT
- ULFUStart为您的跟踪服务检验做准备-Services-ULcom.PDF
- UNFPA估计世界人口总数在2050年时将达到94亿.PPT
- 一种基于MapReduce的粗糙集并行属性约简算法-中国云计算.PDF
- 一种基于分叉点脊线相似度的指纹匹配算法-计算机应用研究.PDF
最近下载
- 《克拉玛依市城市总体规划》(2014-2030年).pdf
- The Blue Planet《蓝色星球(2001)》第一季第三集完整中英文对照剧本.docx VIP
- 新教科版五年级上册科学全册教学反思.doc
- 抗风湿病药物性肝损伤诊治中国专家共识(2024年版)解读.pptx
- GB 50966-2014 电动汽车充电站设计规范.docx
- 国家开放大学《商务英语4》章节自测1-8参考答案.pdf
- 实验九 动物细胞内微丝结构的观察(鬼笔环肽标记法).ppt
- 全国大学生职业规划大赛获奖PPT模板.pptx
- 《机械设计基础(第三版)习题册》参考答案.pdf VIP
- The Blue Planet《蓝色星球(2001)》第一季第四集完整中英文对照剧本.docx VIP
文档评论(0)