一种基于后缀项表的并行闭频繁项集挖掘算法 parallel closed frequent itemset mining algorithm with postfix-table.pdfVIP
- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于后缀项表的并行闭频繁项集挖掘算法 parallel closed frequent itemset mining algorithm with postfix-table
第31卷第2期 计 算 机 应 用 研 究 Vol.31No.2
2014年2月 ApplicationResearchofComputers Feb.2014
一种基于后缀项表的并行闭频繁项集挖掘算法
1,2 1
唐颖峰 ,陈世平
(1.上海理工大学 管理学院,上海200093;2.上海对外经贸大学教务处,上海201620)
摘 要:对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁
项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实
验表明,该算法可以有效缩短平均挖掘时间,对于高维大数据具有较好的性能。
关键词:频繁项集挖掘;并行挖掘算法;MapReduce;闭频繁项集;后缀项表
中图分类号:TP31;TP3016 文献标志码:A 文章编号:10013695(2014)02037305
doi:10.3969/j.issn.10013695.2014.02.013
Parallelclosedfrequentitemsetminingalgorithmwithpostfixtable
1,2 1
TANGYingfeng ,CHENShiping
(1.BusinessSchool,UniversityofShanghaiforScience&Technology,Shanghai200093,China;2.AcademicAffairsSection,ShanghaiUniver
sityofInternationalBusiness&Economics,Shanghai201620,China)
Abstract:BasedoncurrentfrequentitemsetsminingusingparallelFPGrowthalgorithmwithMapReduceframework,thispa
perproposedaparallelclosedfrequentitemsetsminingalgorithmwithapostfixtablebasedonMapReduceframework.Theal
gorithmgeneratedclosedfrequentitemsetsinsteadofallfrequentitemsets.Withapostfixtablestructure,thealgorithmcould
reducetheamountofdatatransferbetweenmappersandreducersefficiently.Theexperimentalresultsshowthatthealgorithm
canshortenminingtimeefficiently.Thealgorithmhasgoodperformanceespeciallyinlongtransctionmode.
Keywords:frequentitemsetsmining;parallelminingalgorithm;MapReduce;closedfrequentitemsets;postfixtable
而言,网络带宽和磁盘I/O是其瓶颈所在,巨大的数据传送量
引言
势必对其产生巨大压力,导致系统效率大大降低。PFP需要
关联规则挖掘是数据挖掘中的一个重要课题,最近几年 传送大量数据的一个重要原因在于,其试图挖掘事务数据中
[1]
您可能关注的文档
- 一类饱和非线性系统抗饱和控制器设计 anti-windup controller design for a class of nonlinear systems subject to actuator saturation.pdf
- 一类不确定非线性时变时滞系统的鲁棒h∞滤波器设计 robust h∞ filter designing for a class of uncertain nonlinear time-varying delay systems.pdf
- 一类不确定非线性系统自适应输出反馈跟踪控制的新结果 new results on adaptive tracking by output feedback for a class of uncertain nonlinear systems.pdf
- 一类不确定非线性系统的鲁棒自适应控制 robust adaptive control of a class of uncertain nonlinear systems.pdf
- 一类不确定离散系统的生存性判别 determining viability for a class of uncertain discrete systems.pdf
- 一类不确定系统鲁棒容错d-稳定性分析 robust fault-tolerant d-stability analysis for a class of uncertain systems.pdf
- 一类不确定系统的神经网络l2-增益鲁棒控制 the neural network l-two-gain robust control for a class of uncertain systems.pdf
- 一类存在数据丢失二维离散系统的h∞滤波 h-infinity filtering for a class of two-dimensional discrete systems with data dropouts.pdf
- 一类仿射非线性系统的概率密度函数形状控制 probability density function shape control of a class of affine nonlinear stochastic systems.pdf
- 一类非线性不确定系统的自适应鲁棒控制 adaptive robust control for a class of uncertain nonlinear system.pdf
- 新的一年工作展望.docx
- 医生年终个人工作的述职报告(3篇).docx
- 2023年消防设施操作员之消防设备中级技能考前冲刺练习题附答案详解.docx
- 2022-2023年环境影响评价工程师之环评技术导则与标准通关练习题包括详细解答.docx
- 2023年中级注册安全工程师之安全生产管理考前冲刺检测卷和答案.docx
- 2023年中级银行从业资格之中级银行管理考前冲刺测试卷提供答案解析.docx
- 2023年公共营养师之二级营养师通关模拟考试试卷附带答案.docx
- 证券分析师之发布证券研究报告业务考前冲刺模拟题库.docx
- 2022-2023年二级建造师之二建建设工程法规及相关知识综合提升测试卷附答案.docx
- 2023年二级建造师之二建机电工程实务通关模拟考试试卷提供答案解析.docx
文档评论(0)