关联分类算法的研究汇总1006.pptVIP

  • 5
  • 0
  • 约2.84千字
  • 约 24页
  • 2018-08-12 发布于湖北
  • 举报
关联分类算法的研究汇总1006.ppt

已完成的工作 算法的执行效率 在构造带类别标识的FP-tree时,在每个节点注册相应类别信息。 扩展TD-FP-Growth算法,使它能直接挖掘满足最小支持度和最小置信度的类关联规则。 优点:两次扫描数据库,不用重复建立条件FP-tree。减少了内存消耗,提高了运行效率。 Hebei University * gjuyk 带类别标识FP-tree的构造 Hebei University * gjuyk 剪枝的质量和效率 关联分类中最敏感的问题 如何评价类关联规则的质量 如何从大量的关联规则中选择有效的规则构造分类器 Hebei University * gjuyk 如何评价类关联规则的质量 经典关联分类规则序关系的定义 给定规则Ri,Rj。 Ri优于Rj,当且仅当满足以下条件之一: Ri具有比Rj更高的置信度 Ri和Rj具有相同的置信度, Ri具有比Rj更高的支持度 Ri和Rj具有相同的置信度和支持度, Ri具有比Rj更少的规则项 Hebei University * gjuyk 经典关联分类规则序关系的缺点 其本质是采用置信度,支持度,规则项数目评价顺序。过分强调了置信度,这样在最后构造的分类器中,使得有些规则置信度很高而支持度不高,造成过度拟合。 综合考虑置信度和支持度。 Hebei University * gjuyk R1: sup(R1) = 100, conf(R

文档评论(0)

1亿VIP精品文档

相关文档