11、数据挖掘期末复习2015PPT.pptVIP

  • 4
  • 0
  • 约3.19千字
  • 约 47页
  • 2018-06-10 发布于江苏
  • 举报
11、数据挖掘期末复习2015PPT

多层关联——一致支持度 VS. 递减支持度 一致支持度:对所有层都使用一致的最小支持度 优点:搜索时容易采用优化策略,即一个项如果不满足最小支持度,它的所有子项都可以不用搜索 缺点:最小支持度值设置困难 太高:将丢掉出现在较低抽象层中有意义的关联规则 太低:会在较高层产生太多的无兴趣的规则 递减支持度:在较低层使用递减的最小支持度 抽象层越低,对应的最小支持度越小 Computer [support=10%] Laptop [support=6%] Desktop [support=4%] min_sup = 5% min_sup = 5% min_sup = 3% 关联规则的兴趣度度量 客观度量 两个流行的度量指标 支持度 置信度 分类和预测 数据分类——一个两步过程 第一步,建立一个模型,描述预定数据类集和概念集 第二步,使用模型,对将来的或未知的对象进行分类 有指导的学习 VS. 无指导的学习 有指导的学习(用于分类) 模型的学习在被告知每个训练样本属于哪个类的“指导”下进行 新数据使用训练数据集中得到的规则进行分类 无指导的学习(用于聚类) 每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的 通过一系列的度量、观察来建立数据中的类编号或进行聚类 数据挖掘——期末复习 数据挖掘概论 什么是数据挖掘? 数据挖掘 (从数据中发现知识) 从大量的数据中挖掘

文档评论(0)

1亿VIP精品文档

相关文档