基于机器学习建模方法我国粮食种植面积影响因素探究.docVIP

基于机器学习建模方法我国粮食种植面积影响因素探究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于机器学习建模方法我国粮食种植面积影响因素探究

基于机器学习建模方法我国粮食种植面积影响因素探究   【摘要】粮食,不仅是人们日常生活的必需食品,还是保证国家粮食供给安全的重要前提。为了综合度量各种因素对粮食总值面积的影响程度,本文建立影响粮食种植面积的指标体系,通过多种建模方法实证分析发现,影响我国粮食种植面积的主要因素有农业劳动力比重、农业机械总动力、农用化肥施用量等,粮食最低收购价格虽然会影响粮食种植面积,但发挥的作用很小 【关键词】粮食 种植面积 指标体系 一、引言 粮食种植面积是保证国家粮食供给安全的重要前提,研究粮食种植面积是十分有意义的。国家粮价收购政策、农业从业人员、粮食进出口贸易、农民受教育程度、城乡收入差距等因素都影响着粮食种植面积,为综合度量各因素对粮食种植面积的影响程度,下文将建立指标体系进一步分析。考虑到数据的可得性,再参考现有文献研究成果的基础上,本文选取投入、产出及可持续发展三个方面的指标建立有关粮食种植面积的指标体系。为了更好的研究它们之间的关系,决定采用多元线性回归模型、Bagging、m-Boosting回归模型、支持向量机回归、决策树、神经网络等方法分别对其进行分析,以期得到最有效的结论 二、方法介?B 在研究变量对变量的影响或变量之间的关系时,人们最先想到的是回归,而线性回归模型的前提假设较多且要求较高,所以现实数据是很难满足这些条件,即使是满足,还要受到其他因素的影响,近年来,随着专家学者们对建模认识的逐渐深入,再加上计算机技术的快速发展,出现了诸如决策树、m-boosting等机器学习算法,这些算法模型在建模之前对数据没有做出任何假定,使用的是诸如一致性、无偏性等概念进行建模,能够很好的解决多元线性回归的不足,预测精度高,所以本文在建模中引入机器学习方法对粮食种植面积进行研究 决策树(Decision Tree)是在已知概率的基础上,通过计算预期的净现值大于或者等于零的概率来评价某一项目运行的风险。随机森林是用随机的方式建立一个“森林”,森林里面有很多的决策树组成。Bagging与m-Boosting算法类似,区别在于Bagging训练集的选择是随机的,各轮训练集之间相互独立,而m-Boosting训练集的选择不是独立的,各轮训练集的选择与前面各轮的学习结果有关。神经网络本质上是人脑处理信息方式的简化模型。支持向量机(SVM,Support Vector Machines)有两种功能,一是对数据进行分类,二是对数据进行回归,目前主要用于对小样本、非线性及高维数据进行分类和回归 三、实证分析 粮食种植面积指标体系的建立是从投入、产出及可持续发展三个角度出发的,投入是指种植粮食的成本,产出是指通过种植粮食获得的收入,可持续发展是综合考虑影响粮食种植面积的其他因素。具体的指标选择如下表: 其中:自然灾害成灾率=成灾面积/受灾面积;人力资本:受教育程度初中及以上劳动力 比重;农业劳动力比重:乡村就业人数占乡村总人口的比重;农业增加值比重=农业增 加值/国内生产总值 数据来源于《中国统计年鉴2015》与《中国农村统计年鉴2015》,时间维度为1990~2014年。粮食最低收购价格用稻谷、小麦和玉米的平均价格计算。由于我国粮食最低收购价格政策是从2005年开始实施的,故粮食的最低收购价格只有2005年之后数据,2004年及之前的粮食最低收购价格用当年粮食的最低收购价格代替 在建模之前为了消除数量级和单位对模型精确性的影响,对数据进行标准化处理,利用标准化之后的数据进行建模,可以得出各种机器学习回归方法关于训练集和测试集的错判率,具体如下表2: 由上表可知,利用随机森林建模所得的训练集与测试集的错判率最低,分别为0.084与0.729,故选择随机森林回归模型作为最终回归模型。通过随机森林回归模型可以得到每个变量的对粮食种植面积的重要性排名,结果显示农业劳动力比重、农业机械总动力、农用化肥施用量、农村居民家庭人均纯收入和农业增加值比重对粮食种植面积的影响排在前五位,其中前三名分别为劳动力投入、机械投入和资本投入,可以看到粮食种植的投入对种植面积的影响很大,排名第四和第五的指标属于地区经济发展水平,显然地区经济发展水平对种植面积的影响也是非常大的 四、研究结论 为了保障粮食安全,我国需要将增加农民收入放在粮食保护政策的第一位。本文从投入、产出及可持续发展三个角度出发建立了粮食种植面积的指标体系,并利用多元线性、Bagging、m-Boosting回归模型、支持向量机、决策树、随机森林、神经网络等回归模型分别对粮食种植面积的影响因素进行了分析,分析表明,使用随机森林建模方法随机森林准确度最高。对影响因素的重要性进行度量可以发现,排名前五位的为农业劳动力比重、农业机械总动

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档