- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
全国极端气温件事空的间关联模式挖掘研究
全国极端气温事件的空间关联模式挖掘研究
0. 引言
近年来,由于全球气候变暖,极端气温事件发生频率变高,强度更大,给社会经济带来了严重的损失[1]。为了更好的掌握气候演变规律,为社会生产生活提供帮助,对极端气温事件的发生、发展及其变化规律的问题的研究已经成为气象以及GIS领域的研究热点[2][3]。
现有的对极端气温事件的研究大多采用基于统计学的方法[4][5],但目前空间数据获取技术的进步使得空间数据日益丰富,超出了传统方法的分析能力,简单的统计学分析已经不能满足需要[6]。因此本文结合传统的数据挖掘技术与地理空间分析方法,设计了一种新的空间关联模式挖掘方法,用于有效识别极端气温事件时空数据集中存在的多种形式的关联模式。
本文的研究通过对全国772个气象台站1961年至2005年极端气温事件时空数据集进行预处理,利用空间数据挖掘的方法获取关联模式,并借助地理空间分析的方法进行进一步的空间分析,探究极端天气在空间上的发生规律。
1. 研究现状
1.1 极端气温事件的研究现状
极端气温事件的提取方法很多,有按照绝对阈值的方法定义极端气候,但目前国际上多采用相对阈值法代替传统的绝对阈值法,在气候极值变化研究中多采用百分位阈值法作为极端值的阈值[7]。IPCC第三次和第四次评估报告在对极端气温时间定义时都采用国际上使用最多的百分位定义法[8],即对研究时间内每个测站的逐月(日)最高(低)气温资料按照降序排列,将某一百分位值定义为该测站该年的极端高(低)温阈值,可根据实际研究的需要以及时间序列长度的不同选择不同百分位等级。
目前关于极端气温事件的研究主要集中在局部区域时空变化特征[9、10]分析、某一独立站点的时间序列分析[11]、集群性分析[7、12]。我国学者对极端气温事件的时空分析研究已有较长历史,取得了大量成果[9-11、13-16]。在局部区域时空变化特征的研究上,有对于秦岭南北地区50来年平均气温、年极端最高、最低气温的时空变化特征分析[10],对山东省降水极值的统计特征和变化趋势的分析等[9];在关于独立站点的时间序列分析的研究上,有对于北京极端气温变化特征与对城市化进程的影响的分析[11]等;另外还有关于极端气温事件的群发性规律的研究[7],定义了K阶最近邻距离丛集点提取算法并对极端气温和降水进行空间分布特征现实的分析。
但是现有的研究多使用统计学方法,建立统计模型进行定量分析,或针对某一独立站点进行时间序列分析,不能满足气温现象作为地理区域化变量存在空间关联的特性,缺少针对站点之间的相互影响与关联的分析。
1.2 空间关联规则挖掘的研究现状
空间关联规则是指空间目标间相邻、相连、共生、包含等关联规则,它是从空间数据库、空间数据仓库发现的主要知识类型之一[6]。自从K.Koperski于20世纪90年代将传统关联规则引入空间数据挖掘领域,并给出空间关联规则的相关概念、挖掘过程和挖掘算法[17]以来,学者们从概念、测度和挖掘算法等方面对空间关联挖掘进行了深入的研究。
已有的空间关联模式挖掘方法大体分成两类:基于空间统计分析的和基于数据挖掘的[18]。现有的相关挖掘算法[19-25]大多是基于对空间数据库的优化和统计学的相关知识,将属于空间关联规则的挖掘问题转化为已经研究比较成熟的传统的属性关联规则挖掘问题,主要关注的是如何解决空间数据库自身海量性、多维性的特点所带来的问题,如何改进传统的挖掘算法,尽可能的提高其在空间数据挖掘上的效率,具有代表性的算法有借助谓词法[23]和基于概念格法[24-25]。传统的挖掘思路为“先数据清理,再知识发现”[26],即先扫描空间数据库,建立所有空间对象的集合,组织成一个关系型事物数据库,然后再进行空间关联规则挖掘。然而,这些算法在用于挖掘空间关联规则时,存在以下局限性:①空间数据具有空间自相关性。研究表明,数据的空间自相关性对空间关联规则的挖掘有很大的作用,而传统的空间关联规则挖掘,一般是使用属性关联规则的挖掘算法,对空间数据进行泛化处理[27],这不仅不能准确反映实际数据的空间关联情况,而且大大降低了挖掘的效率;②传统算法多是基于统计学的算法,在将空间问题非空间化时,是对GIS数据库进行重新整理的过程,必然会丢失其空间特征,损失信息,影响挖掘结果[23];③传统算法先创建空间事务,再依次对其进行分析或挖掘的方式并不能有效的挖掘出含有多种内容的空间关联规则,在挖掘成本、挖掘效率和挖掘精度等方面都存在很多问题,导致大量的空间知识尚未被挖掘出来。
因此,本文结合传统关联规则挖掘技术和地理空间分析方法,设计了一种新的空间关联模式挖掘方法,它基于“先挖掘再分析”的思维模式,首先用传统的数据挖掘技术对时空数据进行预处理,找出潜在频繁的空间关联模式;然后再
文档评论(0)