- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于偏最小二乘回归作物腾发量预测模型研究
基于偏最小二乘回归作物腾发量预测模型研究
摘要:为了建立较为精确的作物腾发量预测模型,降低常规利用彭曼公式计算繁琐及参数估计的难度,应用偏最小二乘回归算法来建立作物腾发量预测模型,采用多维气象数据(太阳辐射、空气温度、相对湿度和平均风速)与作物腾发量的相关性来确定模型方程。结果表明,该模型能很好地解决作物腾发量与多个影响因素之间的不确定性和非线性关系,预测精度较高,完全能够满足灌溉的精度要求。
关键词:偏最小二乘回归;作物腾发量;彭曼公式;预测模型
中图分类号:S161.4 文献标识码:A 文章编号:0439-8114(2013)22-5596-03
我国是一个水资源不丰富的国家,进入21世纪,工农业生产用水矛盾更加突出,水资源紧缺的状况日益严峻,在各个用水部门中,灌溉用水最多,约占全国总用水量的80%,这就迫使农业灌溉排水领域要不断更新观念,其中研究和推广高效的节水灌溉理论与技术,是我国发展节水农业、设施农业,实现高产、高效、优质农业的重要途径,对缓解我国日益突出的水资源供需矛盾具有十分重要的战略意义[1,2]。
作物腾发量包括植株蒸腾与棵间蒸发,是农业用水的主要组成部分,是农田水分消耗的主要途径。作物腾发量的研究与估算,一直是灌溉排水领域中重要的研究课题之一[3,4]。实测方法是获取作物腾发量最可靠的途径,但实测资料的地区分布和时间序列十分有限。计算作物腾发量有助于作物腾发量在空间上的插补和时间序列上的延长[5]。但是常规彭曼公式计算法需要大量的气候、作物等数据,而且要对大量数据进行估算,计算非常繁琐。因此随着其他学科的发展,出现许多作物腾发量预测方法及预测模型,本试验是对特定作物和土壤条件下,通过偏最小二乘回归算法利用天气环境参数来预测作物腾发量(ET)[6-8]。
1 多重共线性分析
1.1 试验条件
本试验数据来自于项目试验基地,天气环境数据通过小型自动采集气象站采集,作物腾发量通过高精度蒸渗仪来测量。2012年5-6月选取典型气候测量50组试验数据,利用得到的试验数据来建立作物腾发量预测模型。试验田长18.0 m,宽6.2 m,土质为沙质??壤,试验所用的作物为玉米,这一阶段玉米处于拔节、抽雄发育期。在测量过程中太阳辐射(RS)取1 d的累计值,相对湿度(RH)、空气温度(TA)和平均风速(WS)取1 d的平均值。试验数据如表1所示。
1.2 多重共线性诊断
在多元回归建模中,变量多重相关的现象经常出现,而偏最小二乘回归方法可以有效解决普通最小二乘法在多重共线性存在的多元回归模型中估计参数失效的问题,因此在建模前有必要诊断数据的多重相关性。自变量间的皮尔逊相关系数矩阵如表2所示。从表2可知,作物腾发量与太阳辐射、相对湿度的相关性较大,分别为0.953和-0.705,其次线性相关性较强的是太阳辐射和相对湿度,相关系数为-0.712,相对湿度与空气温度间的相关性略强,为0.442,从相关系数矩阵中可以初步判断除了因变量和自变量间有线性相关性之外,自变量间也可能存在共线性问题。
特征根和条件指数是诊断多重共线性的方法,如果相当多维度的特征根等于0,则可能有比较严重的共线性,条件指数由Stewart等提出,当某些维度的该指标数值大于30时,则可能存在共线性。表3的自变量多重共线性诊断显示数据间存在一定的多重共线性。
2 模型原理及其构建
2.1 偏最小二乘回归建模思路
首先,对数据进行标准化处理,消除量纲影响。然后,分别在自变量组与因变量组中提取出t和u,满足条件:① t和u最大程度携带各自数据的变异信息;② t与u的相关度达最大。当第一个成分被提取后,偏最小二乘回归分别实施自变量对t的回归和因变量对t的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用自变量被t解释后的残余信息以及因变量被t解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。判断是否继续提取成分的方法是检验交叉有效性Q2h,满足条件Q2h≤0.097 5时,停止计算。
2.2 作物腾发量的偏最小二乘回归模型
根据以上建模过程,结合作物腾发量与相关因素的关系,建立如下标准化模型:
在表4中,符号RdX表示成分th对X的解释能力,符号RdY表示成分th对Y的解释能力。符号Q2表示交叉有效性,临界值0.097 5,前3个成分的交叉有效性均大于临界值,系统默认提取3个有效成分th,h=1,2,3。第一个成分对X的解释能力为0.429 0,第二个成分对X的解释能力为0.378 0,第三个成分对X的解释能力为0.140 0。3个成分对X的信息利用率为0.946 0,基本提取了所有信息。第一个成分对Y的解释能力为0.871 0
文档评论(0)