区域洪涝灾害损失评估及预测的CART模型研究.doc

下载文档 降价啦

11
0
约8.51千字
约 9页
2017-02-13 发布于天津
举报
版权申诉
保障服务

区域洪涝灾害损失评估及预测的CART模型研究.doc

1、本文档共9页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

区域洪涝灾害损失评估及预测的CART模型研究

区域洪涝灾害损失评估及预测的CART模型研究 ——以湖南省为例摘要：选择湖南省14个地级市(州)1995-2009年4-9月降水量、降水量的距平百分率、最高水位值以及对应年份的年末耕地面积、农作物受灾面积、受灾人口、人口密度、产值密度8类指标作为自变量，损失率为因变量，构建指标体系，利用分类与回归树模型逐级提取出了造成洪涝灾害损失的主要因子，依次为农作物受灾面积、受灾人口、7月降水量、6月降水距平百分率、9月降水量以及人口密度。同时确定了影响阈值，当农作物受灾面积不超过56.8×103hm2，且受灾人口少于158.2万人时，预测损失级别为1，属于微灾；而农作物受灾面积超过81.1×103hm2，7月降水量少于343mm，6月降水距平百分率大于94.5%时，预测损失级别为5，属极重灾。CART模型应用简单、结果客观，为洪涝灾害损失评估及预测开辟了一条新途径。关键词：洪涝灾害；CART模型；损失评估；预测；湖南省 0 引言 20世纪90年代以来，全球自然灾害发生频率呈明显上升趋势[1]，其中洪涝灾害是发生最为频繁的灾种之一，具有复杂性特征[2]，近年来的发生频率也越来越高[3]，损失十分严重。目前，洪涝灾害损失评估方法较多，主要集中于致灾因子与损失的关系研究，国际上通常是建立淹没水深、洪水历时等与损失的函数模型[4]，基于水文物理过程的动力学模型[5]等；国内常用方法则有模糊综合评判法[6]、神经网络法[7]、极值模型[8]等，而这些方法均具有局限性。传统的多元线性回归由于自变量之间存在共线性，掩盖了某些因子的作用，从而影响模型的精度[9]。洪涝灾害损失评估一般包括人口、经济、社会及生态等方面，造成损失的因子众多，且存在区域差异[10]，如何从这些复杂的因素中客观地提取出主要因子，并将其影响程度量化，是做好洪灾直接和间接损失评估的基础。目前此类研究还较少，分类与回归树(classification and regression tree，简称CART)模型恰好能够解决此类问题，它通过递归方式将多维白变量进行划分，提取主要影响变量，允许混合的标度单位，同时可以解决回归方法中假设过于严格的问题[11]，能更加准确地把握自变量和因变量之间的关系，并对因变量做出预测，因而具有良好的应用前景。目前国际上已应用于临床医学诊断[12]、雪灾风险评估[13]、生物信息学[14]等领域；国内在故障诊断[15]、矿产分类与预测[16]等领域也有应用。本研究以湖南省为例，尝试将CART模型应用于区域洪涝灾害损失评估指标体系，逐级提取主要影响因子，并根据分类条件对损失级别做出预测，结果精度较高。因此，CART模型可以作为洪涝灾害损失评估及预测的工具，为洪灾综合风险管理与防范服务。 1 研究区概况湖南省位于长江中游南部，东、西、南三面环山，以山地丘陵为主，北部为洞庭湖平原，地势低平。全省属于亚热带季风湿润气候，河网密集，5km以上河流多达5341条，河川年径流总量达2.136×1011m3[17]，除少部分属于珠江和赣江水系外，主要隶属于湘、资、沅、澧四水，并沿地形呈扇状汇入洞庭湖。特有的自然地理环境是湖南省成为农业大省的重要基础，同时也是易于发生各类自然灾害的环境条件，在此环境背景下形成的相对脆弱的人地关系模式，经常受到山洪灾、渍灾及溃灾等灾害的冲击，造成严重的损失。洞庭湖区作为全国重要的商品粮基地和工业原料供应地，人为干扰严重，洪灾发生频繁，其他山地丘陵地区如湘西、怀化及娄底等地也经常出现严重洪涝灾情。因此，选取湖南省作为研究区具有代表性，其研究结果对其他区域的洪涝灾害研究具有重要的借鉴意义。 2 研究方法与数据来源 2.1 研究方法 2.1.1 CART模型概述。CART模型是由Breiman等提出的一种非参数非线性的回归方法[18]，主要包含两个关键思想：一是递归划分自变量空间，另一个是用验证数据进行剪枝。CART模型由根节点、中间节点和终节点组成，预测值为终节点中因变量的平均值，构建步骤为：将所有样本(X)作为根节点，通过分割函数选择分割变量，并确定分割阈值(S)，即将X≤S或X＞S作为分割规则。假定样本被分入j类的先验概率为Pj，其中。令pj/t为节点t中第j类样本的比例(0≤P(j/t)≤1,j=1，2，…，J)，J为样本类的总个数，通过搜索特征P(j/t)，决定每一个X的最佳分枝，然后在最佳X的t节点处进行分割。在分类过程中，属于j类的样本被误分到i类的成本C(t/j)称为错判成本[19]，C(t/j)≥0，当i=j时，Ci/j=0(i=1，2，…，J)。对节点进行分割的目的是不断降低子节点的不纯度，方法主要有熵值法