- 11
- 0
- 约5.09千字
- 约 20页
- 2017-05-09 发布于湖北
- 举报
大数据经典算法Apriori讲解资料
算法:Apriori。使用逐层迭代方法基于候选产生找出频繁项集。 输入: D:实物数据库; Min_sup:最小支持度计数阈值。 输出:L:D中的频繁项集。 方法: L1=find_frequent_1-itemsets(D); for(k=2;Lk-1 !=¢;k++){ Ck=apriori_gen(Lk-1); For each 事务 t∈D{//扫描D用于计数 Ct=subset(Ck,t);//得到t的子集,它们是候选 for each候选c∈C; C.count++; } Lk={c∈C|c.count=min_stp} } return L=UkLk; Procedure apriori_gen(Lk-1:frequent(k-1)-itemsets) for each项集l1∈Lk-1 for each项集l2∈Lk-1 If (l1[1]=l2[1]) ^ (l1[2]=l2[2]) ^… (l1[k-2]=l2[k-2]) ^ (l1[k-1]=l2[k-1]) then{ c=l1∞l2//连接步:产生候选 if has_infrequent_subset(c,Lk-1)then delete c;//剪枝部;删除非频繁的候选 else add c to Ck; } return Ck; procedure has_infrequent_subset
您可能关注的文档
- 大型施工单位内部培训--模板工程资料.ppt
- 大孔树脂分离荷叶生物碱资料.ppt
- 大学中国古代史第六讲契丹与西夏兴衰资料.ppt
- 大学人体解剖循环系统资料.ppt
- 大学动物学--动物地理分布资料.ppt
- 大学动物学--多细胞动物起源资料.ppt
- 大学动物学--哺乳纲2资料.ppt
- 大学动物学--棘皮动物资料.ppt
- 大学动物学--线形动物资料.ppt
- 大学动物学--环节动物资料.ppt
- 2026年智慧健康管理系统创新报告.docx
- 河北衡水市武强中学2025-2026学年高二下学期4月期中物理试题(含解析).docx
- 2026年人工智能行业智能老年防走失定位器创新报告.docx
- 2026年低空经济飞行器量子技术应用创新报告.docx
- 2026年农业智能农业智能育种创新报告.docx
- 河北省保定市莲池区保定市第一中学2025-2026学年高二下学期期中考试生物试题(含解析).docx
- 2026年智慧城市电子站牌充电创新报告.docx
- 河北省邯郸市平恩中学等校2025-2026学年八年级期中考试英语试题(含解析).docx
- 2026年供应链创新技术应用报告.docx
- 2026年体育智能赛事管理系统支付系统创新报告.docx
最近下载
- 08.2024注安【技术】HY-章节必做题.pdf VIP
- 化疗后骨髓抑制的管理PPT课件.pptx VIP
- B0.765-36-0.6背压汽轮节能升级技术方案(1).doc VIP
- 放射性核素有效治疗.ppt VIP
- 2025年职业技能芳香疗法师-理论知识参考题库含答案解析(5套).docx VIP
- 中医中胰瘅的护理.pptx VIP
- HIOKI日置 MR8880-21存储记录仪使用说明书.pdf VIP
- 2025年河海大学计算机科学与技术专业《数据库原理》科目期末试卷及答案.docx VIP
- 数据恢复实战 NTFS文件系统概述 NTFS文件系统概述.ppt VIP
- DB35T 2200-2024 高标准农田建设与管护技术规程.pdf VIP
原创力文档

文档评论(0)