决策树分类算法的时间和性能测试介绍.docVIP

  • 18
  • 0
  • 约1.1万字
  • 约 21页
  • 2016-05-09 发布于湖北
  • 举报

决策树分类算法的时间和性能测试介绍.doc

决策树分类算法的时间和性能测试 姓名: ls 学号: 目录 一、项目要求 3 二、基本思想 3 三、样本处理 4 四、实验及其分析 9 1.总时间 9 2.分类准确性. 12 五、结论及不足 13 附录 14 一、项目要求 设计并实现决策树分类算法(可参考网上很多版本的决策树算法及代码,但算法的基本思想应为以上所给内容)。 使用 UCI 的基准测试数据集,测试所实现的决策树分类算法。评价指标包括:总时间、分类准确性等。 (3) 使用 UCI Iris Data Set 进行测试。 基本思想 决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性变量上的测试,每个分支代表一个测试输出,而每个叶子节点代表类或分布,树的最顶层节点是根节点。 当需要预测一个未知样本的分类值时,基于决策树,沿着该树模型向下追溯,在树的每个节点将该样本的变量值和该节点变量的阈值进行比较,然后选取合适的分支,从而完成分类。决策树能够很容易地转换成分类规则,成为业务规则归纳系统的基础。 决策树算法是非常常用的分类算法,是逼近离散目标函数的方法,学习得到的函数以决策树的形式表示。其基本思路是不断选取产生信息增益最大的属性来划分样例 集和,构造决策树。信息增益定义为结点与

文档评论(0)

1亿VIP精品文档

相关文档