决策树C4完整版本.5算法在森林资源二类调查中的应用.pdfVIP

  • 1
  • 0
  • 约8.51千字
  • 约 4页
  • 2024-01-14 发布于北京
  • 举报

决策树C4完整版本.5算法在森林资源二类调查中的应用.pdf

维普资讯

第31卷第3期南京林业大学学报(自然科学版)Vo1.31,No.3

2007年5月JournalofNanjingForestryUniversity(NaturalSciencesEdition)May.2007

决策树C4.5算法在森林资源二类调查中的应用

王阗,余光辉

(1.南京林业大学信息科学技术学院,江苏南京210037;2.南京林业大学森林资源与环境学院,江苏南京210037)

摘要:C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法。它主要包括数据预处

理、决策树生成、决策树修剪、决策树规则提取等步骤。笔者将C4.5算法应用于森林资源二类调查的数据分

析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景。

关键词:数据挖掘;决策树;森林资源;C4.5算法

中图分类号:TP3--05文献标识码:A文章编号:1000—2006(2007)03—0115—04

ApplicationofC4.5BasedDecisionTreeAlgorithmAbout

InvestigationdAnalysisofForestryResources

WANGTian.SHEGuang—hui

(1.CollegeofInformationScienceandTechnologyNanjingForestryUniversity,Nanjing210037,China;2.CollegeofForest

ResourcesandEnvironmentNanjingForestryUniversity,Nanjing210037,China)

Abstract:C4.5algorithmisaclassicdecision—tree—baseddata—miningalgorithm.Itclassifies

andanalyzesdatabasedoninformationentropytheory.Itmainlyincludessuchfollowing

stepsaspre—processionofdata,creationofdecision—tree,pruningofdecision—tree,rulesex—

tractionfromdecision—tree.C4.5algorithmisintroducedinthispaper,anditisappliedina

dataanalysisonsecond-stageinvestigationofforestryresources.Thepromisingprospectof

dataminingininvestigationanddataanalysisofforestryresourceshasbeenproved.

Keywords:Datamining;Decisiontree;Fo.restryresources;C4.5algorithm

数据挖掘(DataMining)是从大量数据中提取或“挖掘”知识。决策树数据挖掘法作为数据挖掘

中的一种重要方法,已应用到各行各业。决策宿是以实例为基础的归纳算法,着眼于从一组无次序、无

规则的事例中推理出决策树表示形式的分类规则。决策树方法中有一种比较经典的C4.5算法引,已

经在金融、医疗等行业得到了成功的应用。笔者利用C4.5算法对森林资源的调查数据进行挖掘分

析,并给出分析结果。

决策树C4.5算法

1.1决策树概述

决策树提供了一种展示“在什么条件下会得到树种为一般用材林

什么值”规则的方法_l5]。比如,在判断样地是否健康

文档评论(0)

1亿VIP精品文档

相关文档