- 4
- 0
- 约4.94千字
- 约 65页
- 2018-12-08 发布于天津
- 举报
分类挖掘:决策树幻灯片课件.ppt
分类挖掘:决策树;决策树算法概述;1 建立决策树,利用训练样本生成决策树模型。
开始,数据都在根节点
递归的进行数据分片
2 修剪决策树
去掉一些可能是噪音或者异常的数据
3 使用决策树对未知数据进行分类
按照决策树上采用的分割属性逐层往下,直
到一个叶子节点
;决策树的核心问题;决策树的核心问题;训练集(Train):数据库中为建立模型而被分析的数据元组形成训练集。
训练集中的单个元组称为训练样本,每个训练样本有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示属性值,c表示类别。
测试集(Test):用于模型参数的估计,评估分类模型的准确率。
验证集(Validation):用于模型误差的估计。;a.模型训练阶段
训练集
b.使用模型
分类阶段
评估准确率(测试集)
对类标号未知的新
数据分类 ;基本算法
自上而下分而治之的方法
开始时,所有的数据都在根节点
所有记录用所选属性递归的进行分割
属性的选择是基于一个启发式规则或者一个统计的度量 (如, information gain)
停止分割的条件
一个节点上的数据都是属于同一个类别
没有属性可以再用于对数据进行分割
;
建树阶段
MakeTree (Training Data T) Partition (T)
您可能关注的文档
最近下载
- 2025重庆市北碚区施家梁镇社区工作者招聘考试真题及答案.docx VIP
- 最新轴线翻身法技术操作考核评分标准.xlsx VIP
- 2025重庆市北碚区静观镇社区工作者招聘考试真题及答案.docx
- 2025年暖通空调期末试题及答案.docx VIP
- 2025内蒙古森工集团招聘工勤技能人员拟录用人员笔试历年备考题库附带答案详解.docx VIP
- 新编基础会计学模拟实验(第五版)实验05日记账的登记.ppt VIP
- 下一站:星辰大海+-2026届高三下学期毕业主题班会.pptx
- 《奇妙的静电》幼儿园大班科学PPT课件.ppt VIP
- 国家基因组科学数据中心数据汇交指南.pdf VIP
- wfb-820系列微机发电机保护装置技术说明书.pdf VIP
原创力文档

文档评论(0)