关联分析与频繁模式挖掘.pptVIP

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
项目2-频繁模式挖掘 项目2-频繁模式挖掘 设计并实现一个频繁模式挖掘软件 要求 不但要输出频繁模式,还要输出频繁模式的支持度(绝对值,即支持度计数)以及在每个支持度下的频繁模式总数 输出文件中每行格式如下: abc: 1000 表示输出模式为abc,其支持度为1000 评价标准 挖掘时间:指从数据输入到内存到生成所有频繁模式及其支持度的时间,不包含输出频繁模式到文件的时间。 项目2 -实验数据 实验数据 Mushroom.dat 基本信息 项目数:120;事务数:8,124 阈值设定(%) 5, 10, 15, 20, 25 Accidents.dat 基本信息 项目数:468; 事务数:340,183 阈值设定(%) 40, 45, 50, 55, 60 T10I4D100K.dat 基本信息 项目数:1000; 事务数:100,000 阈值设定(%) 0.5, 0.4, 0.3, 0.2, 0.1 对每个阈值,给出该阈值下频繁项集的个数。 项目2-数据格式 1 3 9 13 23 25 34 36 38 40 52 54 59 63 67 76 85 86 90 93 98 107 113 2 3 9 14 23 26 34 36 39 40 52 55 59 63 67 76 85 86 90 93 99 108 114 2 4 9 15 23 27 34 36 39 41 52 55 59 63 67 76 85 86 90 93 99 108 115 1 3 10 15 23 25 34 36 38 41 52 54 59 63 67 76 85 86 90 93 98 107 113 2 3 9 16 24 28 34 37 39 40 53 54 59 63 67 76 85 86 90 94 99 109 114 2 3 10 14 23 26 34 36 39 41 52 55 59 63 67 76 85 86 90 93 98 108 114 2 4 9 15 23 26 34 36 39 42 52 55 59 63 67 76 85 86 90 93 98 108 115 项目2-图表样例 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 频繁模式个数 项目2-Deadline 2016年5月29日之前(含29日)提交 源代码:标明组名 报告(PPT):文件名为组名 PPT中注明姓名和学号 同时注明项目分工,按贡献从大到小排序 每组都要在课堂上作报告 指明所用编程语言和运行环境 将上述材料打包发送到助教沈戈晖 jueliangguke@ 实验室:理科2号楼2320室2016年5月30日课堂报告 每组10分钟:8分钟报告+2分钟提问 提示:邮件中不要包含数据集 下一讲 基本聚类算法 See you next time ? * N为频繁1-项集数目 * 1.显然,根据1-itemset的定义,是按照前序序号排列的。 2.反证。首先这两个值不可能相等。所以不是,就是。因此,如果是。根据前后序编码的特点,这两个节点必须存在祖先-后代关系。而这是不肯能的,应为这两个节点的标签都是同一个项。所以只能是. * Node-list的高效合并算法-示例 第2步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6, (23, 21): 7} i1i3 ={(5, 1): 3, (8, 5): 2 , (10, 6): 2, (18, 19): 6, (24, 20): 5} 7 8, 8 5。所以节点(7, 8) 是节点(8, 5)的祖先。故把(8, 5): 2输入到i1i2i3 的Node-list 中。 第三步,检测(7, 8) 与节点(10, 6)的祖孙关系 i1i2i3 ={(8, 5): 2} 添加 Node-list的高效合并算法-示例 第3步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6, (23, 21): 7} i1i3 ={(5, 1): 3, (8, 5): 2, (10, 6): 2 , (18, 19): 6, (24, 20): 5} 7 10, 8 6。所以节点(7, 8) 是节点(10, 6)的祖先。故把(10, 6): 2输入到i1i2i3 的Node-list 中。第四步,检测(7, 8) 与节点(18, 19)的祖孙关系。 i1i2i3 ={(8, 5): 2, (10, 6): 2 } 添加 Node-list的高效合并算法-示例 第4步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6 , (23,

文档评论(0)

wendan118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档