- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                基于决策树耕地质量评价研究
                    基于决策树耕地质量评价研究
    摘要:本文介绍了决策树的基本概念以及决策树在耕地质量评价中的意义,并以汕尾市陆河县为例,用决策树建立了陆河县耕地质量评价模型,耕地质量模型的建立为陆河县的耕地质量评价以及改进陆河县的耕地质量、提高耕地质量水平具有一定的现实指导意义。 
  关键词:耕地;评价;决策树 
  中图分类号:F301.21文献标识码: A 文章编号: 
  决策树是一树状结构,它从根结点开始,对数据样本进行测试,根据不同的结果将数据样本划分成不同的数据样本子集,每个数据样本子集构成一子节点。在决策树的生成过程中包含了下列思想:在构造树的每层时,选择一个具有最高信息增益的属性,使得依据该属性的值,将对象集被剖分成几个不相交的子集。每个子集表示为树的一个子节点,以该属性的相应值标识到这些子节点的弧。 
  耕地质量评价是对区域耕地资源质量的综合评定,其评价过程不仅复杂,而且具有很强的技术性。针对不同耕地区域,各个评价属性权重确定大多掺入了人为因素,从而影响了评价结果的准确性。基于决策树的耕地质量评价,将克服传统的耕地评价方法中人为因素过多的缺点,提高耕地评价的效率和准确性;另外将决策树模型用在耕地评价中也具有鲜明的生产实践意义。 
  一、本地区的决策树耕地质量的控制 
  1.目标数据集的创建 
  目标数据集的创建工作主要包括:耕地评价单元的划分、确定评价因素和建立评价数据库,目标数据集是从评价数据库中导出的耕地属性数据。 
  评价单元的划分是依据陆河县2004年土地利用现状分幅图(1:10000)的土地利用现状图,在MAPGIS系统环境下从土地利用现状图中分离提取出县耕地图斑,作为工作底图,将选定的参评因素图与工作底图进行叠加,得出的最小图斑即为评价单元,最终确定30281个图斑为陆河县耕地评价单元。 
  在采集数据后,需要对图形数据和属性数据输入建库,形成图形数据库和属性数据库,并对其分别管理,其中图形数据库采用层次型管理方法;属性数据和统计数据则采用关系模型管理。利用地理信息系统的空间叠加功能,将评价工作底图分别与各评??因素图进行叠置分析,提取各评价单元因素属性值,构架耕地评价单元空间数据库。 
  2.基于决策树模型耕地质量评价模型的建立 
  (1)评价样本集的构成 
  本次决策树学习样本的选择是运用试验的方式从聚类方法得到的500、1000、2000、4000、6000和8000个样本空间中进行选择,当满足一定的预测精度时,此时最小的样本空间就是最合适的模型学习样本;测试样本采用全部的评价单元,来验证模型的准确性。 
  (2)决策树属性选择 
   在决策树建立过程的每个选择点上,在C5.0算法中,采用增益率最大的属性是用来进一步细分树结构而选取的属性。下面介绍计算耕地评价属性以A为代表的增益率的公式如2.1: 
   (2.1) 
  对于一组I实例,计算Gain(A)公式如2.2: 
   (2.2) 
  其中:Info(I)为包含在当前被检查实例集合中的信息,Info(I,A)为根据属性A的可能结果划分I中的实例之后的信息。 
  对于n个可能的类,计算Info(I)的公式如2.3: 
   (2.3) 
  在I被划分为k个输出结果后,Info(I,A)计算公式如2.4: 
   (2.4) 
  最后,SplitInfo(A)标准化增益的计算如2.5,从而消除具有许多输出结果的属性选择偏差。 
   (2.5) 
  (3)决策树模型的建立 
  本次决策树模型建立的目的明确,是对耕地的质量进行等级评价即质量等级的划分,确定质量等级是决策树模型的主属性,作为模型的输出属性。它是一个独立的数据变量,属于离散型数据,分为一级、二级、三级、四级。地形,田面坡度,地下水位,有效土层厚度,土壤表层质地,剖面构型,表层有机质含量,pH值,灌溉保证率,排水条件10个评价指标为模型的输入属性,并且在数据输入过程中已将10个评价指标进行了离散化处理。 
  本次决策树算法采用C5.0算法,训练开始时,为所有实例指定相同的权重,在建立最后一个模型后,那些被模型正确分类的实例的权重减少了,被错误分类的实例的权重增加了。一旦建立好所有模型,每个模型被赋予一个权重,其值基于模型对训练数据的性能。所以执行较好的模型在分类过程中有较多的权力。对未正确的分类的样本被更频繁的取样,使决策树模型在分类训练数据的能力上彼此补充。 
  为了提高决策树模型的学习精度,本次研究引入决策误差代价,在进行质量等级的判读时,设置当判别发生错误的时候,所花费的代价不同。当质量等级为一级,误判为二级、三级和四级其代价权重为0.3,0.6,1;当质量等级为二级,误判为一级、三级和四级其代价权重为0.3,0.3,0.6。根据等级距离的不
                您可能关注的文档
最近下载
- 五年级数学奥数讲义.pdf VIP
- 牛羊屠宰兽医卫生检验人员理论考试题库及答案.docx VIP
- 牛品种改良与人工授精技术培训课件.ppt
- 五年级数学奥数讲义134讲.doc VIP
- 2025年综合类-电力机车钳工-电力机车钳工(高级技师)历年真题摘选带答案(5卷单选题100题).docx VIP
- 2025年综合类-电力机车钳工-电力机车钳工(高级)历年真题摘选带答案(5卷单选题100道).docx VIP
- 2025年综合类-电力机车钳工-电力机车钳工(高级)历年真题摘选带答案(5卷单选一百题).docx VIP
- 2025年综合类-电力机车钳工-电力机车钳工(高级技师)历年真题摘选带答案(5卷单选100题合辑).docx VIP
- 马来酸氯苯那敏片详细说明书与重点.docx VIP
- 2025年综合类-电力机车钳工-电力机车钳工(高级技师)历年真题摘选带答案(5卷单选一百题).docx VIP
 原创力文档
原创力文档 
                        

文档评论(0)