关联分析与频繁模式挖掘.pptVIP

下载本文档

7
0
约2.4万字
约 100页
2017-08-19 发布于四川
举报
版权申诉

关联分析与频繁模式挖掘.ppt

1、本文档共100页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

项目2－频繁模式挖掘项目2－频繁模式挖掘设计并实现一个频繁模式挖掘软件要求不但要输出频繁模式，还要输出频繁模式的支持度（绝对值，即支持度计数）以及在每个支持度下的频繁模式总数输出文件中每行格式如下： abc: 1000 表示输出模式为abc，其支持度为1000 评价标准挖掘时间：指从数据输入到内存到生成所有频繁模式及其支持度的时间，不包含输出频繁模式到文件的时间。项目2 －实验数据实验数据 Mushroom.dat 基本信息项目数：120；事务数：8,124 阈值设定（％） 5, 10, 15, 20, 25 Accidents.dat 基本信息项目数：468；事务数：340,183 阈值设定（％） 40, 45, 50, 55, 60 T10I4D100K.dat 基本信息项目数：1000；事务数：100,000 阈值设定（％） 0.5, 0.4, 0.3, 0.2, 0.1 对每个阈值，给出该阈值下频繁项集的个数。项目2－数据格式 1 3 9 13 23 25 34 36 38 40 52 54 59 63 67 76 85 86 90 93 98 107 113 2 3 9 14 23 26 34 36 39 40 52 55 59 63 67 76 85 86 90 93 99 108 114 2 4 9 15 23 27 34 36 39 41 52 55 59 63 67 76 85 86 90 93 99 108 115 1 3 10 15 23 25 34 36 38 41 52 54 59 63 67 76 85 86 90 93 98 107 113 2 3 9 16 24 28 34 37 39 40 53 54 59 63 67 76 85 86 90 94 99 109 114 2 3 10 14 23 26 34 36 39 41 52 55 59 63 67 76 85 86 90 93 98 108 114 2 4 9 15 23 26 34 36 39 42 52 55 59 63 67 76 85 86 90 93 98 108 115 项目2－图表样例 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 频繁模式个数项目2－Deadline 2016年5月29日之前（含29日）提交源代码：标明组名报告（PPT）：文件名为组名 PPT中注明姓名和学号同时注明项目分工，按贡献从大到小排序每组都要在课堂上作报告指明所用编程语言和运行环境将上述材料打包发送到助教沈戈晖 jueliangguke@ 实验室：理科2号楼2320室2016年5月30日课堂报告每组10分钟：8分钟报告+2分钟提问提示：邮件中不要包含数据集下一讲基本聚类算法 See you next time ? * N为频繁1-项集数目 * 1.显然，根据1-itemset的定义，是按照前序序号排列的。 2.反证。首先这两个值不可能相等。所以不是，就是。因此，如果是。根据前后序编码的特点，这两个节点必须存在祖先－后代关系。而这是不肯能的，应为这两个节点的标签都是同一个项。所以只能是. * Node-list的高效合并算法－示例第2步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6, (23, 21): 7} i1i3 ={(5, 1): 3, (8, 5): 2 , (10, 6): 2, (18, 19): 6, (24, 20): 5} 7 8, 8 5。所以节点(7, 8) 是节点(8, 5)的祖先。故把(8, 5): 2输入到i1i2i3 的Node-list 中。第三步，检测(7, 8) 与节点(10, 6)的祖孙关系 i1i2i3 ={(8, 5): 2} 添加 Node-list的高效合并算法－示例第3步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6, (23, 21): 7} i1i3 ={(5, 1): 3, (8, 5): 2, (10, 6): 2 , (18, 19): 6, (24, 20): 5} 7 10, 8 6。所以节点(7, 8) 是节点(10, 6)的祖先。故把(10, 6): 2输入到i1i2i3 的Node-list 中。第四步，检测(7, 8) 与节点(18, 19)的祖孙关系。 i1i2i3 ={(8, 5): 2, (10, 6): 2 } 添加 Node-list的高效合并算法－示例第4步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6 , (23,