20110801303计科三班吕良datamining2.docVIP

  • 144
  • 0
  • 约2.15千字
  • 约 4页
  • 2017-06-08 发布于重庆
  • 举报
20110801303计科三班吕良datamining2

第二次作业 1.Apriori算法使用子集支持性质的先验知识。 (a) 证明频繁项集的所有非空的子集也必须频繁。min_sup 是最小支持度阀值,任务相关的数据D是数据库事务D|是D 有事务量,则有Support_count(s) = min_sup×|D|; 再设s’是s的非空子集,则任何包含项集s的事务将同样包含项集s’ , 即: support_ count(s) support count(s) = min_sup ×|D|. 所以,s’也是一个频繁项集。 (b) 证明项集非空子集’的支持的支持一数据库事务D|是D 的事务量,由定义 设s’是s的非空子集,由定义)support(s’) support(s) 由此证明,项集非空子集’的支持的支持一 答:设 s 是 l 的子集, 则 设s’是s的非空子集,则 由(b)support_count(s) support count(s), 此外,confidence(s’) (l-s’)) confidence(s) (l- s)) 所以,规则的置信度不可能大于。 (d) Apriori 算法的一种变形将事务数据库D 中的事务划分成n 个不重叠的分区。证明 在D 中频繁的项集至少在D 的一个分区中是频繁的。 答:假设频繁项集在D的任何部分中都不频繁。? 设F为D的任何频

文档评论(0)

1亿VIP精品文档

相关文档