- 8
- 0
- 约1.14万字
- 约 71页
- 2017-02-28 发布于河北
- 举报
2-dtree-决策树
* Guilin * 建立的决策树 * Guilin * 评估技术 Holdout: 训练集合/测试集合 数据集合很大时较好 k-fold交叉验证: 将数据集合分成k子集合 在每次建树时,使用一个子集合作为测试集合,其它k-1子集合一起作为训练集合 用这k次结果的均值作为参照 它消除了训练集合/测试集合方法的随机性 * Guilin * * 交叉验证图解 数据集合分成k段 一个做测试,其它的用来训练分类器 重复到 Test iteration * Guilin * 增益率 增益率(Gain ratio):是信息增益的一个改良版,它可以减少信息增益偏好于取值较多的属性 增益率考虑分支数目和分枝的大小 它通过内在信息改良信息增益值 也称为分裂率 内在信息:分支里的记录分布的熵 * Guilin * 增益率的定义 增益率一般是 数据均匀分布时很大 数据集中于某个枝时很小 增益率(Quinlan’86))标准化信息增益 * Guilin * 有关决策树分类器的研究问题 分裂属性选择标准 过度拟合(Overfitting) 低度拟合(Underfitting) 评估技术 非均匀数据/类(Imbalanced data/classes) 多标记学习 半监督分类 * Guilin * Summary 决策树的定义 决策树的使用 如何建树 分裂属性选择 不纯度 信息增益
您可能关注的文档
- 诊断试剂行业产业链竞争趋势及企业内外部资源整合策略咨询.pdf
- 试论国际航运企业竞争力系统.pdf
- 论产业集群竞争力的内涵和性质.pdf
- 论后发优势企业的国际竞争策略_以海尔国际化创新发展为例.pdf
- 行业投资策略-2013下半年传媒行业策略报告-屌丝逆袭,.pdf
- 评估体系.pdf
- 谈判的真理-彭福东.pdf
- 财务管理(第五章投资决策)k.pdf
- 财务报表分析系统.pdf
- 课件-第五部分-非上市公众公司并购重组(陈沁).pdf
- 光的折射与透镜复习.pptx
- 第一课时平移的概念与性质.pptx
- 小学音乐二年级上册《打花巴掌》进阶复习知识清单.docx
- 第10课时勾股定理及其应用(3).pptx
- 九年级英语下册Unit9 Section B 1a1d听说课教学设计.docx
- -综合与实践学生体质健康调查与分析(2).pptx
- Unit6Lesson1AMedicalPioneer说课课件-高中英语北师大版.pptx
- Unit1TeenageLife派生词和重点单词课件-高中英语人教版.pptx
- 初中七年级英语下册 Unit 5 Why do you like pandas 单元整合复习导学案.docx
- 家庭关系处理.pptx
原创力文档

文档评论(0)