数据挖掘3数据分类36课件讲解.pptxVIP

  • 1
  • 0
  • 约6.16千字
  • 约 26页
  • 2026-02-09 发布于陕西
  • 举报

;分裂信息;C4.5算法由机器学习学者J.RossQuinlan在1993年提出,旨在解决其前身ID3算法在实际应用中的几个关键缺陷。它不仅是理论上的完善,更是一个在现实中得到广泛应用的、更为强大和鲁棒的决策树生成工具。

C4.5的核心思想可以概括为:在继承ID3使用信息论进行属性选择这一核心优点的同时,通过一系列工程技术,克服其在实际应用中的短板,生成更简洁、更通用、泛化能力更强的决策树模型。

它主要针对ID3的四大局限进行了改进:

(1)对多值属性的偏好,ID3的信息增益准则倾向于选择取值数目多的属性。

(2)无法处理连续值特征,ID3只能处理离散型属性。

(3)对缺失值敏感,ID3无

文档评论(0)

1亿VIP精品文档

相关文档