数据挖掘3数据分类96课件讲解.pptxVIP

  • 1
  • 0
  • 约5.85千字
  • 约 26页
  • 2026-02-09 发布于陕西
  • 举报

;基尼不纯度;CART由LeoBreiman等人于1984年提出,它统一了分类和回归任务的框架,其核心特征在于二叉树结构、基尼不纯度准则以及强大的剪枝技术。

CART的核心思想是采用递归的二分法。在每一个节点,它只提出一个是/否问题,将数据划分为两个子集。这个过程不断重复,直到满足停止条件,最终生成一棵二叉树。其目标是找到一系列的二值划分,使得生成的所有子集(叶节点)的“不纯度”最小。;基尼不纯度是CART算法用于分类任务时选择划分特征的准则。

(1)定义

基尼不纯度的定义是从一个数据集中随机抽取两个样本,它们属于不同类别的概率。

这个概率越高,说明数据集越混乱,不纯度越大。概率越低,说明数

文档评论(0)

1亿VIP精品文档

相关文档