郭平Random-Forests.ppt

森林中单颗树的分类强度(Strength):每颗树的分类强度越大,则随机森林的分类性能越好。 森林中树之间的相关度(Correlation):树之间的相关度越大,则随机森林的分类性能越差。 5)随机森林分类性能的主要因素 6)随机森林的几个理论要点 (1)收敛定理 它度量了随机森林对给定样本集的分类错误率。 (2)泛化误差界 单个决策树的分类强度越大,相关性越小,则泛化误差界越小,随机森林分类准确度越高。 (3)袋外估计 Breiman在论文中指出袋外估计是无偏估计,袋外估计与用同训练集一样大小的测试集进行估计的精度是一样的。Using out

文档评论(0)

1亿VIP精品文档

相关文档