随机森林实验报告.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
. 随机森林实验报告 实验目的 实现随机森林模型并测试。 实验问题 Kaggle 第二次作业 Non-linear classification 算法分析与设计 一.算法设计背景 : 1. 随机森林的原子分类器一般使用决策树, 决策树又分为拟合树和分类树。 这两者的区 别在于代价估值函数的不同。 2. 根据经验,用拟合树做分类的效果比分类树略好。 3. 对于一个 N 分类问题 , 它总是可以被分解为 N 个 2 分类问题,这样分解的好处是其决 策树更加方便构造, 更加简单, 且更加有利于用拟合树来构建分类树。 对于每一个 2 分类问 题,构造的树又叫 CART树,它是一颗二叉树。 4. 将 N个 2 分类树的结果进行汇总即可以得到多分类的结果。 5.CART树构造: 教育范文 . 6. 随机森林构造: 二.算法思路: 将一个 N 分类问题转化为 N 个二分类问题。 转化方法是: 构造 N棵二叉拟合树, 这里假 设 N 为 26 ,然后我们给 N棵二叉树依次标号为 1,2, 3...26 。1 号树的结果对应于该条记 录是不是属于第一类,是则输出 1,否则输出 0.2 号树的结果对应于该条记录是不是属于第 二类,是则 1 否则 0,依此类推。这样,我们的 26 棵二叉树的结果就对应了 26 个下标。 例如对于某条记录,这 26 个二叉树的结果按序号排列为 {0 ,0,0 ,0 ,0, 0,0 ,0 ,0,0 , 0,0 ,0,0,0 ,...1,0} ,那么这条记录的分类应该为 25。要将一个 26 维的 0, 1 序列变 回 一个索引,我们只需要找出这个序列中值最大的元素的索引,这个索引即是序列号。 我们将上面的 26 棵分别对 26 个索引做是否判断的二分类树视为一个整体, 在多线程的 环境下, 构造多个这样的整体, 然后进行求和运算, 最后取出每个结果序列中值最大的元素 的下标作为分类值,那么久得到了我们想要的结果,随机森林完成。 三.算法流程: 1. 读入训练集 trainset, 测试集 testset 2. 将训练集分割为输入 trainIn, 输出 trainOut 3. 这里假设类别数 N 为 26 ,将 trainOut[ 记录条数 ] 映射为 transformTrainOut[ 训练记录 数][26] 4. 初始化 transformTestOut[ 测试记录数 ][26] 全部为 0 5.For i = 1 : ForestSize: // 对训练集采样,这里要注意输入和输出一致 [sampleIn,transformSampleOut] = TakeSample(trainIn,transformTrainOut) For category = 1 : 26: //CartTree 数组存放着 26 棵二分类树 CartTree[category] = TrainCartTree(sampleIn,transformSampleOut); end //transformTestOut[ 测试记录数 ][26] 为承接二分类树输出的容器 for i1 = 1 : testSetNum: For category = 1 : 26: transformTestOut[i1][category]

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档