- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.
随机森林实验报告
实验目的
实现随机森林模型并测试。
实验问题
Kaggle 第二次作业 Non-linear classification
算法分析与设计
一.算法设计背景 :
1. 随机森林的原子分类器一般使用决策树, 决策树又分为拟合树和分类树。 这两者的区
别在于代价估值函数的不同。
2. 根据经验,用拟合树做分类的效果比分类树略好。
3. 对于一个 N 分类问题 , 它总是可以被分解为 N 个 2 分类问题,这样分解的好处是其决
策树更加方便构造, 更加简单, 且更加有利于用拟合树来构建分类树。 对于每一个 2 分类问
题,构造的树又叫 CART树,它是一颗二叉树。
4. 将 N个 2 分类树的结果进行汇总即可以得到多分类的结果。
5.CART树构造:
教育范文
.
6. 随机森林构造:
二.算法思路:
将一个 N 分类问题转化为 N 个二分类问题。 转化方法是: 构造 N棵二叉拟合树, 这里假
设 N 为 26 ,然后我们给 N棵二叉树依次标号为 1,2, 3...26 。1 号树的结果对应于该条记
录是不是属于第一类,是则输出 1,否则输出 0.2 号树的结果对应于该条记录是不是属于第
二类,是则 1 否则 0,依此类推。这样,我们的 26 棵二叉树的结果就对应了 26 个下标。
例如对于某条记录,这 26 个二叉树的结果按序号排列为 {0 ,0,0 ,0 ,0, 0,0 ,0 ,0,0 ,
0,0 ,0,0,0 ,...1,0} ,那么这条记录的分类应该为 25。要将一个 26 维的 0, 1 序列变
回
一个索引,我们只需要找出这个序列中值最大的元素的索引,这个索引即是序列号。
我们将上面的 26 棵分别对 26 个索引做是否判断的二分类树视为一个整体, 在多线程的
环境下, 构造多个这样的整体, 然后进行求和运算, 最后取出每个结果序列中值最大的元素
的下标作为分类值,那么久得到了我们想要的结果,随机森林完成。
三.算法流程:
1. 读入训练集 trainset, 测试集 testset
2. 将训练集分割为输入 trainIn, 输出 trainOut
3. 这里假设类别数 N 为 26 ,将 trainOut[ 记录条数 ] 映射为 transformTrainOut[ 训练记录
数][26]
4. 初始化 transformTestOut[ 测试记录数 ][26] 全部为 0
5.For i = 1 : ForestSize:
// 对训练集采样,这里要注意输入和输出一致
[sampleIn,transformSampleOut] = TakeSample(trainIn,transformTrainOut)
For category = 1 : 26:
//CartTree 数组存放着 26 棵二分类树
CartTree[category] = TrainCartTree(sampleIn,transformSampleOut);
end
//transformTestOut[ 测试记录数 ][26] 为承接二分类树输出的容器
for i1 = 1 : testSetNum:
For category = 1 : 26:
transformTestOut[i1][category]
您可能关注的文档
最近下载
- 2024屋顶分布式光伏电站建设规范.docx VIP
- 小学英语语法课件-人称代词课件(全国通用版)(共90张PPT).pptx VIP
- 2025年2月上海市高三联考高考调研英语试题(答案详解) .pdf VIP
- ccs软件与proteus联合仿真建立dsp虚拟实验系统.pdf VIP
- 2023-2024学年福建省福州市连江三中八年级(上)第一次月考数学试卷+答案解析.pdf VIP
- 蒙医护理教学查房.pptx VIP
- 一种分离提纯铱的方法.docx VIP
- IPC-2223E-中文-2020 CN 挠性和刚挠性印制板计件分标准.pdf VIP
- 《神奇的彩虹》幼儿园大班科学PPT课件.pptx VIP
- 初二【语文(统编)】新闻写作(第一课时)捕捉新闻要素巧成文.pptx VIP
文档评论(0)