数据挖掘十大算法之C4.5.pptxVIP

  • 7
  • 0
  • 约小于1千字
  • 约 31页
  • 2018-09-04 发布于河北
  • 举报
数据挖掘十大算法之C4.5

第一章 C4.5;主要内容 引言 算法描述 算法特性 决策树剪枝 连续型属性 缺失值处理 规则集诱导 软件实现 示例 高级主题 二级存储 斜决策树 特征选择 集成方法 分类规则 模型重述 ;引言;C4.5算法所用数据集的一个示例;引言;算法描述;算法描述;利用 C4.5 算法获得的决策树;从数据中诱导出这样的树所面临的各种选择;有哪些可能测试类型?;如何对测试进行选择?;如何选取测试的阈值?;如何决定停止树生长?;如何确定叶节点类别?;信息增益和信息增益率;在树诱导过程中,C4.5算法的目标就通过合适的提问来获得信息,实现这个熵值的下降。熵值的下降幅度就成为信息增益。;信息增益和信息增益率;信息增益和信息增益率;说明;决策树剪枝;基于成本复杂度的剪枝 ;错误消减剪枝;悲观剪枝;基于理想置信区间剪枝;连续型属性;缺失值处理;第一个问题:;第二个问题:;第三个问题:;规则集诱导;Thank you!

文档评论(0)

1亿VIP精品文档

相关文档