- 1、本文档共100页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
项目2-频繁模式挖掘 项目2-频繁模式挖掘 设计并实现一个频繁模式挖掘软件 要求 不但要输出频繁模式,还要输出频繁模式的支持度(绝对值,即支持度计数)以及在每个支持度下的频繁模式总数 输出文件中每行格式如下: abc: 1000 表示输出模式为abc,其支持度为1000 评价标准 挖掘时间:指从数据输入到内存到生成所有频繁模式及其支持度的时间,不包含输出频繁模式到文件的时间。 项目2 -实验数据 实验数据 Mushroom.dat 基本信息 项目数:120;事务数:8,124 阈值设定(%) 5, 10, 15, 20, 25 Accidents.dat 基本信息 项目数:468; 事务数:340,183 阈值设定(%) 40, 45, 50, 55, 60 T10I4D100K.dat 基本信息 项目数:1000; 事务数:100,000 阈值设定(%) 0.5, 0.4, 0.3, 0.2, 0.1 对每个阈值,给出该阈值下频繁项集的个数。 项目2-数据格式 1 3 9 13 23 25 34 36 38 40 52 54 59 63 67 76 85 86 90 93 98 107 113 2 3 9 14 23 26 34 36 39 40 52 55 59 63 67 76 85 86 90 93 99 108 114 2 4 9 15 23 27 34 36 39 41 52 55 59 63 67 76 85 86 90 93 99 108 115 1 3 10 15 23 25 34 36 38 41 52 54 59 63 67 76 85 86 90 93 98 107 113 2 3 9 16 24 28 34 37 39 40 53 54 59 63 67 76 85 86 90 94 99 109 114 2 3 10 14 23 26 34 36 39 41 52 55 59 63 67 76 85 86 90 93 98 108 114 2 4 9 15 23 26 34 36 39 42 52 55 59 63 67 76 85 86 90 93 98 108 115 项目2-图表样例 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 频繁模式个数 项目2-Deadline 2016年5月29日之前(含29日)提交 源代码:标明组名 报告(PPT):文件名为组名 PPT中注明姓名和学号 同时注明项目分工,按贡献从大到小排序 每组都要在课堂上作报告 指明所用编程语言和运行环境 将上述材料打包发送到助教沈戈晖 jueliangguke@ 实验室:理科2号楼2320室2016年5月30日课堂报告 每组10分钟:8分钟报告+2分钟提问 提示:邮件中不要包含数据集 下一讲 基本聚类算法 See you next time ? * N为频繁1-项集数目 * 1.显然,根据1-itemset的定义,是按照前序序号排列的。 2.反证。首先这两个值不可能相等。所以不是,就是。因此,如果是。根据前后序编码的特点,这两个节点必须存在祖先-后代关系。而这是不肯能的,应为这两个节点的标签都是同一个项。所以只能是. * Node-list的高效合并算法-示例 第2步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6, (23, 21): 7} i1i3 ={(5, 1): 3, (8, 5): 2 , (10, 6): 2, (18, 19): 6, (24, 20): 5} 7 8, 8 5。所以节点(7, 8) 是节点(8, 5)的祖先。故把(8, 5): 2输入到i1i2i3 的Node-list 中。 第三步,检测(7, 8) 与节点(10, 6)的祖孙关系 i1i2i3 ={(8, 5): 2} 添加 Node-list的高效合并算法-示例 第3步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6, (23, 21): 7} i1i3 ={(5, 1): 3, (8, 5): 2, (10, 6): 2 , (18, 19): 6, (24, 20): 5} 7 10, 8 6。所以节点(7, 8) 是节点(10, 6)的祖先。故把(10, 6): 2输入到i1i2i3 的Node-list 中。第四步,检测(7, 8) 与节点(18, 19)的祖孙关系。 i1i2i3 ={(8, 5): 2, (10, 6): 2 } 添加 Node-list的高效合并算法-示例 第4步检测祖孙关系 i1i2 ={ (7, 8): 10 , (15, 15): 6 , (23,
您可能关注的文档
- 关于大家对北京市各科高考改革的看法的开题报告.ppt
- 关于大自然的好词.ppt
- 关于大学生校园公德的调查问卷.ppt
- 关于如何进行XX集团内部整合工作的建议.ppt
- 关于如何教小学英语阅读课的一个示例课件.ppt
- 关于嫦娥奔月的资料.ppt
- 关于学习型组织.ppt
- 关于安徽工程大学地超营销策划.ppt
- 关于学生作息时间与学习效率的研究.ppt
- 关于小学英语课标.ppt
- 中国行业标准 DB/T 100-2024区域性地震安全性评价.pdf
- 《GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架》.pdf
- GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- DB/T 100-2024区域性地震安全性评价.pdf
- 中国行业标准 GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- 校园周边书店阅读氛围对初中生阅读素养提升的影响研究教学研究课题报告.docx
- 初中校园餐饮卫生监管与食品安全教育创新模式研究教学研究课题报告.docx
- 《文化遗产保护与旅游开发平衡机制的法律法规完善研究》教学研究课题报告.docx
- 《农作物病虫害生物防治技术的经济效益与社会影响分析》教学研究课题报告.docx
- 1 剖宫产术后子宫瘢痕憩室治疗中的并发症预防与护理措施教学研究课题报告.docx
最近下载
- 药事管理学药品注册管理课件.ppt VIP
- 《肩袖损伤与肩周炎》课件.ppt VIP
- 2024年重庆市巴蜀中学初升高自主招生语文试卷真题(含答案).docx VIP
- 中介新房培训课件内容.ppt VIP
- 2024年重庆渝中区重庆市巴蜀中学自主招生数学试卷(初升高保送)(详解版).pdf VIP
- 2025年西藏自治区公务员录用考试面试真题试卷(结构化小组)题型分析.docx VIP
- 药品注册管理课件.ppt VIP
- 击剑基础理论知识单选题100道及答案解析.docx VIP
- 《未成年人保护法》课件ppt.pptx VIP
- (高清版)B-T 19363.1-2022 翻译服务 第1部分:笔译服务要求.pdf VIP
文档评论(0)