随机森林在棉蚜虫害等级预测中的应用.docVIP

随机森林在棉蚜虫害等级预测中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机森林在棉蚜虫害等级预测中的应用.doc

随机森林在棉蚜虫害等级预测中的应用   摘 要:棉蚜是棉区的主要农业害虫之一,对于棉花的产量和质量影响较大。为了准确地对棉蚜虫害的等级进行分类预测,以便采取科学的防治措施,该研究对山东省滨州地区1990―2009年的20年中5―9月的平均气温、降水量、相对湿度、日照时数等气象数据、棉蚜天敌数据与棉蚜虫害数据进行了相关性分析,筛选后保留的影响因子数据构建随机森林棉蚜虫害等级预测模型。结果表明:随机森林模型的OOB为5.7%,等级的误分率为0.09和0.019,经测试集检验,模型预测的准确率为82.2%。模型泛化性好,等级的误分率低。   关键词:随机森林;棉蚜;气象因子;等级预测   中图分类号 TP391;S431 文献标识码 A 文章编号 1007-7731(2017)01-0018-03   Abstract:Cotton aphid is one of the main agricultural pests of cotton,for greater effects on the yield and quality of cotton. In order to accurately classify the level of cotton aphid pest forecast,through the acquisition of Binzhou area of Shandong Province region from May to September in 1990-2009,average temperature,precipitation,relative humidity,sunshine hours and other meteorological data and cotton aphid enemies and Aphis gossypii pest data correlation analysis,screening of meteorological data to build a random forest pests and Aphis gossypii level prediction model.Experimental results show that the random forest model of OOB was 5.7%,the level of point error rate was 0.09 and 0.019,have examined the test set and model prediction accuracy is 82.2%.The generalization of the model is good,and the rate of misclassification is low.   Key words:Random forest;Cotton aphid;Meteorological factors;level Prediction   棉花是我国重要的经济作物之一,山东省滨州地区棉花种植面积广泛。棉蚜是造成棉花减产的主要害虫之一,由于其发生时间长,繁殖速度快,危害严重且防治困难,在一定程度上制约了滨州地区棉花的优质和高产。而气象条件和天敌数量均对棉蚜产生直接的影响,为有效防治棉蚜的危害,学者们对棉蚜虫害的预测进行了大量的研究。如张金[1]等采用逐步判?e分析法分析了气候条件和棉蚜虫害等级的关系,构建了新疆石河子地区棉蚜多元线性回归预测模型。吴昊[2]等对九江鄱阳湖地区棉蚜发生规律和预报方法进行了研究,以丰富该地区的棉蚜预报方法。慕彩云[3]等对东疆地区的棉蚜预测构建了日预测、月预测及旬预测的线性回归模型。目前,在棉蚜预测模型的构建中多运用线性回归,但是在线性回归分析中采用何种因子进行表达只是一种推测,从而影响了因子的多样性和不可测性,使得回归分析在某些情况下的使用受到限制。   随机森林在运算量没有显著提高的前提下提高了预测精度,并且对于多元共线性不敏感,对缺失数据和非平衡数据比较稳健[4],而且模型训练速度快,样本选择具有随机性,不易产生过拟合。为此,本实验将随机森林用于棉蚜虫害等级的短期预测中,提高了棉蚜预测的效率和准确率,从而可以及时地为农业生产者提供准确的预警信息,提前采取防治措施,降低棉蚜对棉花的危害。   1 随机森林算法   随机森林算法[5]是2001年加利福尼亚大学的Leo Breiman提出的,是一种由多个决策树组成的集成分类算法。集成学习现已成为国际机器学习界研究的热点机器学习范式[6]。随机森林中引入了2个随机化过程,使得不同的分类树具有不同的分类能力,当输入待分类样本时,随机森林输出的结果由每个

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档