- 5
- 0
- 约5.69千字
- 约 39页
- 2016-05-09 发布于江苏
- 举报
数据挖掘:决策树算法及应用拓展.ppt
决策树生成 基本思想: 用途:提取分类规则,进行分类预测 决策树示意图 使用决策树进行分类 决策树 一个树性的结构 内部节点上选用一个属性进行分割 每个分叉都是分割的一个部分 叶子节点表示一个分布 决策树生成算法分成两个步骤 树的生成 开始,数据都在根节点 递归的进行数据分片 树的修剪 去掉一些可能是噪音或者异常的数据 决策树使用: 对未知数据进行分割 按照决策树上采用的分割属性逐层往下,直到叶子节点 决策树算法 基本算法(贪心算法) 自上而下分而治之的方法 开始时,所有的数据都在根节点 属性都是种类字段 (如果是连续的,将其离散化) 所有记录用所选属性递归的进行分割 属性的选择是基于一个启发式规则或者一个统计的度量 (如, information gain) 停止分割的条件 一个节点上的数据都是属于同一个类别 没有属性可以再用于对数据进行分割 伪代码(Building Tree) Procedure BuildTree(S) 用数据集S初始化根节点R 用根结点R初始化队列Q While Q is not Empty do { 取出队列Q中的第一个节点N if N 不纯 (Pure) { for 每一个属性 A 估计该节点在A上的信息增益 选出最佳的属性,将N分裂为N1、N2 } } 属性选择的统计度量 信息增
您可能关注的文档
- 攀枝花学院办公室编印 2007年9月2日.doc
- 改进文化艺术教学加快.doc
- 改革开放之我见.doc
- 政府融资平台建设(黄煦凯)中华讲师网.ppt
- 政治学业水平测试试卷.doc
- 政治学原理课程题库2005版.doc
- 教学反思,促进我们专业成长.doc
- 教学系统设计的内涵和性质.ppt
- 教师发展年总结.doc
- 教师发展部总结.doc
- 赤峰市巴林左旗2025-2026学年第二学期三年级语文期中考试卷(部编版含答案).docx
- 伊春市桦南县2025-2026学年第二学期三年级语文第五单元测试卷(部编版含答案).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库含答案详解(a卷).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库及答案详解(有一套).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库含答案详解(名师推荐).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库及答案详解(精选题).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库及答案详解(易错题).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库及答案详解(新).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库及答案详解(夺冠).docx
- 2026黑龙江黑河市嫩江市乡镇卫生院招聘医学相关专业毕业生2人备考题库及答案详解(夺冠系列).docx
原创力文档

文档评论(0)