- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于极值理论河南省火灾数据分析
基于极值理论河南省火灾数据分析
摘要:进入21世纪以来,随着经济的飞速发展,造成火灾的各种因素越来越多,我国的火灾发生频率一直以来居高不下。本文基于河南省2007年至2012年的火灾数据,采用极值方法对河南省近6年的直接经济损失较大的极端火灾进行分析。得出河南省火灾直接经济损失重现水平,其中5年期重现水平为322.3万元,为下一步消防部门安排工作重心提供参考依据,为今后火灾数据的统计分析工作提供研究方向。
关键词:火灾形势;直接经济损失;极值理论
中图分类号: X928 文献标识码:A
近年来,随着经济社会的迅猛发展,致灾因素明显增多,火灾发生几率和控制难度相应增大,河南省每年发生火灾五千多起,伤亡百余人,造成的直接财产损失超过1亿元,给人们的生命财产造成巨大损失,因此,人们希望能过预知灾害的发生,以便采取针对性的措施减少火灾损失。
火灾的发生具有很大意义上的随机性,并且造成火灾的原因多种多样,火灾过程复杂多变,对于火灾现象的研究现在仍在继续,通常采用统计的方法来对火灾原始数据进行分析。有些人认为采用统计的方法对火灾数据进行分析并不能帮助我们更好的理解火灾发生发展的整个屋里过程,然而极值分析可以通过火灾原始数据得到很多有用的信息。本文主要研究通过一元极值理论对2007-2012年河南省火灾原始数据进行分析。
一、利用极值理论进行火灾数据分析
(一)基础极值理论
从概率的角度来看,随机变量中极端变异的数据称为极值;从统计学的角度来看,极值是随机变量中极大值和极小值的统称。极值统计理论对数据进行分析的主要任务就是根据基于某样本的观测数据的极值建立一个概率模型,但是这需要观测数据具有一定的特征,主要有以下三个要求:(1)观测数据是随机变量;(2)该随机变量的底分布保持不变,若有变化,也应该可以通过数据处理来降低这些变化带来的影响;(3)观测数据中的极值之间是相互独立的,不能有潜在的联系,若有联系,可以采用一些合理方法对其进行处理。极值类型定理又称最大值极限分布定理,它表明在经过线性变换后,独立同分??的极大值序列依分布收敛于一个非退化分布。也就是说,在经过标准化以后,极值的渐进分布必为Gumbel、Frechet、Weibull三种类型之一。这一定理是极值理论的核心内容,它提供了类似于中心极限定理的极值收敛定理。
(二)阈值模型和选取
区组最大模型会造成数据的极大浪费,而我们关心的是分位数的估计,因此利用超过某一阈值的极值数据建模,这种抽取极值的方法就称为POT方法(Peak over threshold),即阈值法。考虑超过阈值u的那些观测值X,可以利用超阈值分布或超出量分布函数来描述。广义Pareto分布(generalized Pareto distribution),简记为GPD分布。GPD分布专门用于描述超过特定阈值的观测数据集的概率分布特征。
阈值越高,超过阈值的样本数就越少,则参数估计的方差增大。反之,虽然增加了估计精度,但又不符合超出量服从GPD分布的要求条件。然而,阈值的选取至今没有一个统一方法。如何合理的确定阈值仍是现阶段极值理论研究中亟待解决的问题。目前选取阈值的方法主要有图解法与计算法两大类。
(三)河南省火灾直接财产损失分析
以河南省2007-2012年6年间的火灾数据为基础进行分析,以图1.1为例,为河南省火灾损失值数据的平均剩余寿命图及相应的95%置信区间,阈值单位为“千元”。由图可见,从u=0到u=500图形为曲线,从直到u=500到u=4000图形近似为直线,超过u=1000,图形急剧下降。这表明应该取u=1000,然而实际情况中在两万多个多个数据中超过1000的数据较少,造成数据的浪费。因此我们取阈值为0到500之间。进而,我们采用判断u值改变引起估计量的变化来确定u值。
在一个阈值取值范围内,利用超出量估计广义Pareto分布的参数,若初始阈值对应的超出量近似为广义Pareto分布,则对大于的值,形状参数的估计值应该保持不变。而却是u的函数,这里是区组最大值的极限分布,即广义极值分布中的尺度参数。
图1. 1河南省2007-2012年全省火灾直接经济损失平均剩余寿命图
由上述情况可知,若选择作为阈值是合适的,那么相应的超出量服从广义Pareto分布,则考虑大于的u,其相应的估计量与保持不变。考虑到抽取样本是随机进行的,这些估计量不可能都为常数,但是它们应该在一个能够接受的抽样误差范围内波动。根据平均剩余寿命图的作法,作以及关于u的曲线并计算相应的95%置信区间,在曲线中能够使两个估计量保持为常数或在小范围内波动的最小u值即可以被选作阈值。通过对0到500之间平均选取的100个值进行GPD模型
您可能关注的文档
最近下载
- 四年级上道德与法治《学会识别广告》教学设计.pdf VIP
- 2024融合大语言模型DeepSeek技术新人教版语文七年级上册《第四单元》大单元整体教学设计[2022课标].pdf
- 监控系统项目完整技术标书.docx VIP
- 临床合理用药解读-质子泵抑制剂的处方和医嘱审核要点解读(PPT课件).pptx VIP
- 山东省化工装置安全试车工作规范 DB37_T 1854—2020 山东.pdf VIP
- 安徽—夏凯月—课件—直线的倾斜角与斜率.pptx VIP
- 房屋租赁合同,房屋租赁合同,房屋租赁合同.docx VIP
- 安徽—夏凯月—设计—直线的倾斜角与斜率.docx VIP
- 业务学习-子宫脱垂.pptx VIP
- 海尔风冷模块样册.pdf
文档评论(0)