一种用于大规模数据集的决策树采样策略.pdfVIP

  • 15
  • 0
  • 约1.15万字
  • 约 3页
  • 2017-08-20 发布于湖北
  • 举报

一种用于大规模数据集的决策树采样策略.pdf

一种用于大规模数据集的决策树采样策略.pdf

SoftwareTechnology 一 种用于大规模数据集的决策树采样策略 赵 国强 .王 会 进 (暨南大学 信 息科学技术学院,广东 广州 510632) 摘 要 :为提 高大规模数据集生成树 的准确率 ,提 出一种预生成一棵基于这个数据集的决策树 , 采 用广度优 先遍 历将其 划分为 满足预定义 的限制 的数据 集 ,再对各数据集按 照一定 比例进 行随机 采 样 .最后将采样 结果整合为 目标数据集的数据采样方法 。通过对一 UCI数据集进行采样 ,并用现有决 策树算法实验证 明,该采样方法优 于传统随机采样方法,基于该采样方法的生成树准确率有所提高。 关键词 :决策树 ;样本选取 ;广度优先遍历 中图分类号 :TP311 文献标识码 :A 文章编号 :1674—7720(2010)21-0005-02 A sampling strategy on decision tree for large data sets ZHAO GuoQiang,WAN

文档评论(0)

1亿VIP精品文档

相关文档