数据仓库与数据挖掘70100.docVIP

  • 3
  • 0
  • 约2.37千字
  • 约 6页
  • 2016-12-30 发布于江西
  • 举报
《数据仓库与数据挖掘》实验 学号 姓名:赵琴琴 关联规则挖掘及其应应用 一 实验题目: Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。它将关联规则挖掘算法的设计分解为两个子问题:(1) 找到所有支持度大于最小支持度的项集,这些项集称被为频繁项集(Frequent Itemset)。(2 在图书馆管理系统中积累了大量的读者借还书的历史记录,基于Apriori算法挖掘最大频繁项目集,由此产生关联规则。数据格式可参阅文献 参考文献:彭仪普,熊拥军: 关联挖掘在文献借阅历史数据分析中的应用.情报杂志. 2005年第8期。 二 算法基本思想的描述: 首先产生频繁1-项集L1,然后是频繁2-项集L2,直到有某个r值使得Lr为空,这时算法停止。这里在第k次循环中,过程先产生候选k-项集的集合Ck,Ck中的每一个项集是对两个只有一个项不同的属于Lk-1的频集做一个(k-2)-连接来 产生的。Ck中的项集是用来产生频集的候选集,最后的频集Lk必须是Ck的一个子集。Ck中的每个元素需在交易数据库中进行验证来决定其是否加入Lk,这 里的验证过程是算法性能的一个瓶颈。 为了生成所有频集,使用了递推的方法。其核心思想简要描述如下: (1)?????L1 = {large 1-itemsets}; (2)?????for (k=2; Lk-1sup1;F; k+

文档评论(0)

1亿VIP精品文档

相关文档