第3章 数据挖掘技术 3.1 分类(Classification) 3.2 关联(Association) 3.3 聚类(Clustering) 3.4 预测(Prediction) 3.5 数据挖掘的可视化 3.6 数据挖掘的实施 3.1 分类 3.1.1 概述 3.1.2 常见的分类算法 3.1.2.1 决策树算法 3.1.2.2 CLS算法 3.1.2.3 ID3算法 3.1.2.4 C4.5算法 3.1.2.5 Autoclass算法 3.1.3 算法实现 3.1.1 分类概述 分类是数据挖掘中的一个重要课题。 分类的目的是获得一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到某一个给定类别。 分类可用于提取描述重要数据类的模型或预测未来的数据趋势。 分类的实现 构建模型:预设分类类别 对每个样本进行类别标记 训练集构成分类模型 分类模型可表示为:分类规则、决策树或数学公式 使用模型:识别未知对象的所属类别 模型正确性的评价 已标记分类的测试样本与模型的实际分类结果进行比较 模型的正确率是指测试集中被正确分类的样本数与样本总数的百分比。测试集与训练集相分离,否则将出现过拟合( over-fitting )现象。 分类方
您可能关注的文档
最近下载
- 《极限驾驶:赛车的艺术与科学》读书记录.pdf VIP
- 2025年全国各省市中考英语真题汇编专题18短文填空含答案.docx VIP
- 2026年安徽省烟草专卖局招聘(100人)笔试备考试题及答案解析.docx VIP
- 2026年安徽省烟草专卖局(公司)招聘100名笔试模拟试题及答案解析.docx VIP
- 2026年安徽省烟草专卖局(公司)招聘100人笔试模拟试题及答案解析.docx VIP
- 轿车液压制动系统设计及仿真分析.doc
- 2025年安徽省烟草专卖局(公司)招聘112人笔试参考试题附答案解析.docx VIP
- 2025年安徽省马鞍山市烟草系统人员招聘笔试试题及答案解析.docx VIP
- 初中七年级(初一)数学下册专题练习版.docx VIP
- 新能源汽车制动系统仿真分析.doc VIP
原创力文档

文档评论(0)