C45算法的分析和實现.docxVIP

  • 70
  • 0
  • 约7.25千字
  • 约 13页
  • 2016-11-26 发布于重庆
  • 举报
C45算法的分析和實现

基于决策树技术的数据挖掘方法分析和研究 ——C4.5算法的分析和实现 摘要 大数据时代已经到来,对数据的处理越来越受到人们的关注,人们迫切需要海量数据背后的重要信息和知识,发现数据中存在的关系和规则,获取有用的知识,并且根据现有数据对未来的发展做出预测。决策树分类算法C4.5算法是数据挖掘中最常用、最经典的分类算法,能够以图形化的形式表现挖掘的结果,从而方便于使用者快速做出决定或预测。决策树实际在各行业应用非常广泛,如客户资源管理(CRM)系统等。本报告从决策树的各个方面对决策树进行分析,理解C4.5算法相对于ID3算法的改进,并对C4.5算法加以实现。同时也指出C4.5算法还存在不足。 关键字:数据挖掘;决策树算法;C4.5算法 一、具体应用场景和意义 决策树(Decision Tree)是用于分类和预测的主要技术,它着眼于从一组无规则的事例推理出决策树表示形式的分类规则,采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较,并根据不同属性判断从该节点向下分支,在决策树的叶节点得到结论。因此,从根节点到叶节点就对应着一条合理规则,整棵树就对应着一组表达式规则。基于决策树算法的一个最大的优点是它在学习过程中不需要使用者了解很多背景知识,只要训练事例能够用属性即结论的方式表达出来,就能使用该算法进行学习。 决策树算法在很多方面都有应用,如决策树算法在医学、制造和生产、金融分析

文档评论(0)

1亿VIP精品文档

相关文档