- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
区域洪涝灾害损失评估及预测的CART模型研究
区域洪涝灾害损失评估及预测的CART模型研究
——以湖南省为例
摘要:选择湖南省14个地级市(州)1995-2009年4-9月降水量、降水量的距平百分率、最高水位值以及对应年份的年末耕地面积、农作物受灾面积、受灾人口、人口密度、产值密度8类指标作为自变量,损失率为因变量,构建指标体系,利用分类与回归树模型逐级提取出了造成洪涝灾害损失的主要因子,依次为农作物受灾面积、受灾人口、7月降水量、6月降水距平百分率、9月降水量以及人口密度。同时确定了影响阈值,当农作物受灾面积不超过56.8×103hm2,且受灾人口少于158.2万人时,预测损失级别为1,属于微灾;而农作物受灾面积超过81.1×103hm2,7月降水量少于343mm,6月降水距平百分率大于94.5%时,预测损失级别为5,属极重灾。CART模型应用简单、结果客观,为洪涝灾害损失评估及预测开辟了一条新途径。
关键词:洪涝灾害;CART模型;损失评估;预测;湖南省
0 引言
20世纪90年代以来,全球自然灾害发生频率呈明显上升趋势[1],其中洪涝灾害是发生最为频繁的灾种之一,具有复杂性特征[2],近年来的发生频率也越来越高[3],损失十分严重。目前,洪涝灾害损失评估方法较多,主要集中于致灾因子与损失的关系研究,国际上通常是建立淹没水深、洪水历时等与损失的函数模型[4],基于水文物理过程的动力学模型[5]等;国内常用方法则有模糊综合评判法[6]、神经网络法[7]、极值模型[8]等,而这些方法均具有局限性。传统的多元线性回归由于自变量之间存在共线性,掩盖了某些因子的作用,从而影响模型的精度[9]。
洪涝灾害损失评估一般包括人口、经济、社会及生态等方面,造成损失的因子众多,且存在区域差异[10],如何从这些复杂的因素中客观地提取出主要因子,并将其影响程度量化,是做好洪灾直接和间接损失评估的基础。目前此类研究还较少,分类与回归树(classification and regression tree,简称CART)模型恰好能够解决此类问题,它通过递归方式将多维白变量进行划分,提取主要影响变量,允许混合的标度单位,同时可以解决回归方法中假设过于严格的问题[11],能更加准确地把握自变量和因变量之间的关系,并对因变量做出预测,因而具有良好的应用前景。目前国际上已应用于临床医学诊断[12]、雪灾风险评估[13]、生物信息学[14]等领域;国内在故障诊断[15]、矿产分类与预测[16]等领域也有应用。
本研究以湖南省为例,尝试将CART模型应用于区域洪涝灾害损失评估指标体系,逐级提取主要影响因子,并根据分类条件对损失级别做出预测,结果精度较高。因此,CART模型可以作为洪涝灾害损失评估及预测的工具,为洪灾综合风险管理与防范服务。
1 研究区概况
湖南省位于长江中游南部,东、西、南三面环山,以山地丘陵为主,北部为洞庭湖平原,地势低平。全省属于亚热带季风湿润气候,河网密集,5km以上河流多达5341条,河川年径流总量达2.136×1011m3[17],除少部分属于珠江和赣江水系外,主要隶属于湘、资、沅、澧四水,并沿地形呈扇状汇入洞庭湖。特有的自然地理环境是湖南省成为农业大省的重要基础,同时也是易于发生各类自然灾害的环境条件,在此环境背景下形成的相对脆弱的人地关系模式,经常受到山洪灾、渍灾及溃灾等灾害的冲击,造成严重的损失。洞庭湖区作为全国重要的商品粮基地和工业原料供应地,人为干扰严重,洪灾发生频繁,其他山地丘陵地区如湘西、怀化及娄底等地也经常出现严重洪涝灾情。因此,选取湖南省作为研究区具有代表性,其研究结果对其他区域的洪涝灾害研究具有重要的借鉴意义。
2 研究方法与数据来源
2.1 研究方法
2.1.1 CART模型概述。CART模型是由Breiman等提出的一种非参数非线性的回归方法[18],主要包含两个关键思想:一是递归划分自变量空间,另一个是用验证数据进行剪枝。CART模型由根节点、中间节点和终节点组成,预测值为终节点中因变量的平均值,构建步骤为:
将所有样本(X)作为根节点,通过分割函数选择分割变量,并确定分割阈值(S),即将X≤S或X>S作为分割规则。假定样本被分入j类的先验概率为Pj,其中。令pj/t为节点t中第j类样本的比例(0≤P(j/t)≤1,j=1,2,…,J),J为样本类的总个数,通过搜索特征P(j/t),决定每一个X的最佳分枝,然后在最佳X的t节点处进行分割。在分类过程中,属于j类的样本被误分到i类的成本C(t/j)称为错判成本[19],C(t/j)≥0,当i=j时,Ci/j=0(i=1,2,…,J)。
对节点进行分割的目的是不断降低子节点的不纯度,方法主要有熵值法
文档评论(0)