- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 利用FP-树进行频繁模式挖掘 思想: 频繁模式增长 递归地增长频繁模式借助模式和数据库划分 方法 对每个频繁项,构建它的条件模式基,然后构建它的条件FP-树. 对每个新创建的条件FP-树重复上述过程 直至结果FP-树为空,或者它仅包含一个单一路径.该路径将生成其所有的子路径的组合,每个组合都是一个频繁模式. * 频繁 1-项集 最小支持度为20% (计数为 2) TID Items 1 I1,I2,I5 2 I2,I4 3 I2,I3,I6 4 I1,I2,I4 5 I1,I3 6 I2,I3 7 I1,I3 8 I1,I2,I3,I5 9 I1,I2,I3 Itemset Support count {I1} 6 {I2} 7 {I3} 6 {I4} 2 {I5} 2 {I6} 1 Itemset Support count {I1} 6 {I2} 7 {I3} 6 {I4} 2 {I5} 2 事务数据库 支持度计数 频繁1-项集 * FP-树 构建 Itemset Support count {I1} 6 {I2} 7 {I3} 6 {I4} 2 {I5} 2 Itemset Support count {I2} 7 {I1} 6 {I3} 6 {I4} 2 {I5} 2 按支持度降序排列 * FP-树 构建 创建根结点 null 扫描数据库 事务1: I1, I2, I5 排序: I2, I1, I5 处理事务 以项的顺序增加结点 标注项及其计数 (I2,1) (I1,1) (I5,1) 1 I5 0 I4 0 I3 1 I1 1 I2 维护索引表 * FP-树 构建 null (I2,2) (I1,1) (I5,1) 0 I5 1 I4 0 I3 0 I1 2 I2 (I4,1) TID Items 1 I1,I2,I5 2 I2,I4 3 I2,I3,I6 4 I1,I2,I4 5 I1,I3 6 I2,I3 7 I1,I3 8 I1,I2,I3,I5 9 I1,I2,I3 * FP-树 构建 null (I2,7) (I1,4) (I5,1) 2 I5 2 I4 6 I3 6 I1 7 I2 (I4,1) TID Items 1 I1,I2,I5 2 I2,I4 3 I2,I3,I6 4 I1,I2,I4 5 I1,I3 6 I2,I3 7 I1,I3 8 I1,I2,I3,I5 9 I1,I2,I3 (I3,2) (I3,2) (I1,2) (I3,2) (I4,1) (I5,1) * FP-树 构建 扫描事务数据库D一次,得到频繁项的集合F及它们的支持度.将F按支持度降序排列成L,L是频繁项的列表. 创建FP-树的根, 标注其为NULL.对D中的每个事务进行以下操作: 根据 L中的次序对事务中的频繁项进行选择和排序. 设事务中的已排序的频繁项列表为[p|P],其中p表示第一个元素,P表示剩余的列表.调用insert_Tree([p|P],T). * 挖掘 FP-tree 从索引表中的最后一个项开始 找到所有包含该项的路径 沿着结点-链接(node-links) 确定条件模式 路径中符合频度要求的模式 构建 FP-tree C 添加项至C中所有路径,生成频繁模式 递归地挖掘C (添加项) 从索引表和树中移除项 * 挖掘 FP-Tree null (I2,7) (I1,4) (I5,1) 2 I5 2 I4 6 I3 6 I1 7 I2 (I4,1) (I3,2) (I3,2) (I4,1) (I5,1) (I1,2) (I3,2) 前缀路径 (I2 I1,1) (I2 I1 I3, 1) 条件路径 (I2 I1, 2) 条件 FP-tree (I2 I1 I5, 2), (I2 I5, 2), (I1 I5, 2) null (I2,2) (I1,2) * 挖掘 FP-Tree 项 条件模式基 条件FP-tree 生成的频繁模式 I5 {(I2 I1:1),(I2 I1 I3:1)} I2:2,I1:2 I2 I5:2, I1 I5:2, I2 I1 I5:2 I4 {(I2 I1:1),(I2:1)} I2:2 I2 I4:2 I3 {(I2 I1:2,(I2:2),(I1:2)} I2:4,I1:2, I1:2 I2 I3:4, I1 I3:2, I2 I1 I3:2 I1 {(I2:4)} I2:4 I2 I1:4 * 由事务数据库构建FP-树 {} f:4 c:1 b:1 p:1 b:1 c:3 a:3 b:1 m:2 p:2 m:1 Header Table Item frequen
您可能关注的文档
最近下载
- 2025重庆长江师范学院科研助理招聘13人笔试参考题库附答案解析.docx VIP
- 国际医学研究报告清单及规范:5-CARE Checklist 案例报告.docx
- 软件概要设计说明书.doc VIP
- 武汉理工大学855信号与系统2022考研真题试卷.pdf VIP
- 爆破行业风险评价方法、爆破作业风险分级管控指南、风险分级管控清单、隐患排查清单、台账.pdf VIP
- 2025年财政部高层次财会人才选拔考试综合试题及答案.docx VIP
- 国际贸易学_金泽虎主编_电子教案.ppt
- 2025年财政部高层次财会人才选拔考试测试题及答案.docx VIP
- 医学三基考试试题及答案.doc VIP
- 2025年职场 性格25PF测试题 .pdf VIP
文档评论(0)