决策树与随机森林:模型构建及应用分析.pdfVIP

  • 2
  • 0
  • 约2.6万字
  • 约 24页
  • 2026-06-01 发布于北京
  • 举报

决策树与随机森林:模型构建及应用分析.pdf

决策树

决策树又称为判定树,是运用于分类的一种树结构。值得一提的是它不需要对数据有任

何的先验假设。它有三种算法:ID3,ID4.5,Gini三类,这三类运用不同的方法和数学原理(信

息增益偏好分类变量多的特征,信息增益率在信息增益基础上考虑分类后的信息纯度做商,

因此较为偏好分类数量较少的特征,Gini通过概率考察程度)

这里我们用到两个决策树建模用的包:rpart与party,小组总结了关于包的相关解释:

RpartParty

分割依据Gini卡方检验

(rpart对“一致”性的默认度(检验P值小于阀值的自变量

量是Gini值)加入模型,相关性最强的自变

文档评论(0)

1亿VIP精品文档

相关文档