- 3
- 0
- 约2.37千字
- 约 6页
- 2016-12-30 发布于江西
- 举报
《数据仓库与数据挖掘》实验
学号 姓名:赵琴琴
关联规则挖掘及其应应用
一 实验题目:
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。它将关联规则挖掘算法的设计分解为两个子问题:(1) 找到所有支持度大于最小支持度的项集,这些项集称被为频繁项集(Frequent Itemset)。(2
在图书馆管理系统中积累了大量的读者借还书的历史记录,基于Apriori算法挖掘最大频繁项目集,由此产生关联规则。数据格式可参阅文献
参考文献:彭仪普,熊拥军: 关联挖掘在文献借阅历史数据分析中的应用.情报杂志. 2005年第8期。
二 算法基本思想的描述:
首先产生频繁1-项集L1,然后是频繁2-项集L2,直到有某个r值使得Lr为空,这时算法停止。这里在第k次循环中,过程先产生候选k-项集的集合Ck,Ck中的每一个项集是对两个只有一个项不同的属于Lk-1的频集做一个(k-2)-连接来 产生的。Ck中的项集是用来产生频集的候选集,最后的频集Lk必须是Ck的一个子集。Ck中的每个元素需在交易数据库中进行验证来决定其是否加入Lk,这 里的验证过程是算法性能的一个瓶颈。
为了生成所有频集,使用了递推的方法。其核心思想简要描述如下:(1)?????L1 = {large 1-itemsets};(2)?????for (k=2; Lk-1sup1;F; k+
您可能关注的文档
最近下载
- 小学六年级英语测试题(006号).doc VIP
- 玉柴YC4D120-20-D1008发动机零件图册.pdf VIP
- 透析正则动量与配速法的应用讲义+跟踪训练.pdf VIP
- 小学五年级英语测试题(010号).doc VIP
- [英语]《开心学英语》小学五上学期英语试题.doc VIP
- 小学英语素材-英语音标发音规则大法.doc VIP
- 2026年高考物理二轮复习微专题六 配速法与洛伦兹力冲量法(复习讲义)(全国通用)(原卷版).docx VIP
- 2025年教育行业五年在线教育发展与用户习惯报告.docx
- 2026吉林新高考:地理必考知识点归纳.doc VIP
- 2023年上海市中考英语试卷真题(含答案)+听力材料.pdf
原创力文档

文档评论(0)