随机森林课件.ppt

;;决策树;决策树;决策树;决策树;决策树;决策树;决策树;决策树;决策树;决策树;决策树;集成学习;集成学习;集成学习;什么是随机森林?;什么是随机森林?;随机森林的特点:

优点:

1.两个随机性的引入,使得随机森林不容易陷入过拟合;

2.两个随机性的引入,使得随机森林具有很好的抗噪声能力;

3.对数据集的适应能力强:既能处理离散型数据,也能处理连续型数据,数据集无需规范化且能够有效地运行在大数据集上;

4.能够处理具有高维特征的输入样本,而且不需要降维;

5.在生成过程中,能够获取到内部生成误差的一种无偏估计;

6.对于缺省值问题也能够获得很好得结果。;缺点:

1.在某些噪音较大的分类或回归问题上会过拟合;

2.对于有不同级别的属性的数据,级别划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产出的属性权值是不可信的。;随机森林中有许多的分类树。如果要将一个输入样本进行分类,需要将输入样本输入到每棵树中进行分类。

打个比喻:

森林中召开会议,讨论某个动物到底是老鼠还是松鼠,每棵树都要独立地发表自己对这个问题的看法,也就是每棵树都要投票。该动物到底是老鼠还是松鼠,要依据投票情况来确定,获得票数最多的类别就是森林的分类结果。森林中的每棵树都是独立的

文档评论(0)

1亿VIP精品文档

相关文档