- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 卷第 期 重 庆 大 学 学 报
41 4 Vol.41No.4
年 月 JournalofChon in Universit
2018 4 A r.2018
gq g y p
: /
doi10.11835 .issn.1000-582X.2018.04.007
j
基于非平衡数据的随机森林分类算法改进
, ,
魏正韬 杨有龙 白 婧
( , )
西安电子科技大学 数学与统计学院 西安 710126
: , 。
摘 要 随机森林算法作为一种组合分类器有较好的分类性能 适合多样的分类环境 算法同
, 。 ,
样也存在一些缺陷 例如算法处理非平衡数据时不能很好地区分正类和负类 针对这一问题 通过
, ,
对抽样结果增加约束条件来改进 Bootstra 重抽样方法 减少抽样对非平衡性的影响 同时尽量保
p
。 ,
证算法的随机性 之后利用生成数据的非平衡系数给每棵决策树进行加权处理 提升对非平衡数
, 。
据敏感的决策树在投票环节的话语权 从而提升整体算法对非平衡数据的分类性能 通过上述两
种改进可以明显提高随机森林在决策树数量不足情况下的分类精度。
: ; ; ;
关键词 非平衡数据 随机森林算法 有条件的Bootstra 重抽样 加权的决策树
p
中图分类号: 文献标志码: 文章编号: ( )
TP391.4 A 1000-582X201804-054-09
Anim rovedrandomforestalorithmbasedonunbalanceddata
p g
, ,
WEIZhentaoYANGYoulon BAIJin
g g g
( , , ’ , )
SchoolofMathematicsandStati
文档评论(0)