数据挖掘05课稿.ppt

数据挖掘的概念与技术 数据分类方法 分类和预测 什么是分类? 什么是预测? 决策树分类 神经网络分类 其他分类方法 预测方法 总结 分类 vs. 预测 分类: 预测类的标志 针对训练数据建立分类模型,利用模型预测未知的类标志 预测: 对连续型变量建立函数依赖,预测未知的或缺失的数据 应用 信用卡审批 目标市场的定位 医疗诊断 有效性分析 分类—A Two-Step Process 建立模型: 描述一组已知的类 每个对象的类标志是已知的,由class label attribute表示 用来建模的对象集合: training set 模型用分类规则,决策树,或数学公式表示 应用模型:利用模型预测类标志 选择一组测试数据检测模型的准确度 测试数据集(test set)与训练数据集是不同的 用模型推导出来的类标志与已知的类标志比较,如果相同,则称结果是正确的 准确度等于测试数据集中由模型得到正确结果的对象比例 分类的过程 (1): 建立模型 分类过程 (2): 根据模型预测 监督学习 vs. 非监督学习 监督学习-Supervised learning (classification) training data 的类标志是已知的 由训练数据集得到模型,用于新的对象 非监督的学习-Unsupervised learning (clustering) training data的

文档评论(0)

1亿VIP精品文档

相关文档