- 3
- 0
- 约2.2万字
- 约 18页
- 2021-06-22 发布于山东
- 举报
源码剖析—— Random
Trees
一、原理
随机森林( Random Forest)的思想最早是由 Ho 于 1995 年首次提出,后来 Breiman 完整系
统的发展了该算法,并命名为随机森林,而且他和他的博士学生兼同事
Cutler 把 Random
Forest 注册成了商标,这可能也是
OpenCV 把该算法命名为 Random Trees 的原因吧。
一片森林是由很多棵树木组成,
森林中的每棵树能够说是彼此不有关,
也就是说每棵树木的
生长完全是由自己条件决定的,
只有保持森林的多样性,
森林才能更好的生长下去。
随机森
林算法与真切的森林相近似,
它是由很多决议树组成,
每棵决议树之间是不有关的。
而随机
森林算法的独特性就体现在
“随机” 这两个字上: 通过随机抽取得到不同的样本来建立每棵
决议树; 决议树每个节点的最正确分叉属性是从由随机得到的特点属性会合中选用。
下面就详
细介绍这两次随机过程。
虽然在生成每棵决议树的时候, 使用的是相同的参数, 但使用的是不同的训练会合, 这些训
练会合是从全体训练样本中随机得到的,这一过程称之为 bootstrap 过程,得到的随机子集称之为 bootstrap 会合,而在 bootstrap 会合的基础上聚集得到的学习模型的过程称之为
Bagging (Bootstrap aggregating) ,那些不
原创力文档

文档评论(0)