数据挖掘算法培训讲义分类和预测.pptVIP

  • 3
  • 0
  • 约9.39千字
  • 约 67页
  • 2019-01-19 发布于江苏
  • 举报
数据挖掘:概念与技术(翻译 张磊) DM算法-1 分类和预测 出处:《数据挖掘:概念与技术》 ?Jiawei Han and Micheline Kamber DM算法-1 分类和预测 什么是分类? 什么是预测? 关于分类与预测的问题 通过决策树归纳来分类 贝叶斯分类 通过反向传播来分类 基于关联规则挖掘的概念来分类 其它分类方法 预测 分类准确率 总结 分类与预测 分类: 预测分类标签 基于训练集和分类属性值(分类标签)构造分类模型,然后用该模型分类新数据 预测: 对连续函数建模, 即预测未知的或缺失的数据 典型应用 信用审核 目标营销 医疗诊断 治疗效果分析 分类—两步骤过程 建立一个模型: 描述预定的数据类或概念集 假定每个元组/样本可以通过类标签属性来确定它属于某个预定义的类 用于创建模型的元组集合: 训练集 模型可以用分类规则, 决策树, 或数学公式来表达 使用模型: 对未知(分类标签的)对象进行分类 模型估计准确率 已知测试样本的分类标签, 将其和模型的分类结果比较 模型在给定测试集上的准确率是正确被模型分类的测试样本的百分比 测试集应独立于训练集, 否则可能导致过度拟合 分类过程 (1): 模型创建 分类过程 (2): 使用模型来预测 有指导的 vs. 无指导的学习 有指导的学习 (分类) 指导: 模型的学习在被告知每个训练样本属于哪个类的“指导”下进行

文档评论(0)

1亿VIP精品文档

相关文档