- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
·86 · 计算机应用研究 2006 年
一 种 最 大 频 繁 模 式 的快 速 挖 掘 算 法
1, 2 1 1, 3
王运鹏 , 胡修林 , 阮幼林
( 1. 华中科技 大学 电子 与信 息工程 系, 湖北 武 汉 430074; 2. 中 国石化 江汉 油 田信 息 中心, 湖北 潜江 433124 ;
3. 武汉理工 大学 信 息工程 学 院, 湖 北 武汉 430070)
摘 要: 挖掘最 大频繁模 式是 多种数据挖掘应 用中的关键 问题 。提 出一种挖掘最 大频繁模 式的快速算 法, 该算
法利 用前缀树压 缩存放数 据, 并通 过调 整前 缀树 中节 点信 息和 节点链 直接 在前 缀树 上采 用深度优 先 的策略进 行
挖掘 , 而不需要创建条件模 式树 , 从 而大大提 高了挖掘效率。
关键 词: 最 大频繁模 式; FP-Tree; 前 缀树 ; 数据 挖掘
中图法分 类号 : TP311. 12 文献标 识码 : A 文章编 号: 1001- 3695( 2006) 10- 0086- 03
Fast Algorithm for Mining Maximum Frequent Patterns
1, 2 1 1, 3
WANG Yun-peng , HU Xiu-lin , RUAN You-lin
( 1. Dept. of Eletronics Information, Huazhong University of Science Technology, Wuhan Hubei 430074, China; 2. Information Center of
Jianghan Oilfield, China Petrochemical Corporation, Qianj iang Hubei 433124, China; 3. College of Information Engineering, Wuhan Universi-
ty of Technology, Wuhan Hubei 430070, China)
Abstract: Mining maximum frequent patterns is a key problem in data mining research. In this paper, a fast algorithm DMFP
based on Prefix Tree for mining maximum frequent patterns is proposed. Prefix Tree stores information in a highly compact
form. DMFP mines frequent patterns in depth-first order and directly in Prefix Tree by adj usting node information and node
links without creating conditional pattern tree. Thus, it improves performance greatly.
Key words: Maximum Frequent Pattern; FP-Tree; Prefix-Tree; Data Mining
频繁模式的挖掘是关联规则、序列分析等许多重要数据挖 量条件模式树, 从而大大提高了挖掘效率。
掘任务的关键步骤 。在 众
您可能关注的文档
- UCAN学生手册-高苑研发处制.PPT
- ULFUStart为您的跟踪服务检验做准备-Services-ULcom.PDF
- UNFPA估计世界人口总数在2050年时将达到94亿.PPT
- 一种基于MapReduce的粗糙集并行属性约简算法-中国云计算.PDF
- 一种基于分叉点脊线相似度的指纹匹配算法-计算机应用研究.PDF
- UnionEmergencyMedicineCentre仁安急症门诊中心08-仁安医院.PDF
- 一种基于工业CT技术的岩芯样品孔隙度测量分析方法-物探与化探.PDF
- Unit桃园国民教育教辅导团.DOC
- 一种基于自适应权值的负载均衡算法.PDF
- Universe-科技主题公园-ProjectZero.PDF
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)