- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
西北太平洋热带气旋问题
摘 要
随着社会经济的不断发展,带给人类生活也在扩大,作为自然灾害之一一直人类重点研究关注的。从信息基础要素之间相关性关系,以及热带发生模型和对热带气旋等级标准的评估与优化展开讨论。太平洋热带气旋基础信息数据,利用相关性显著性指标分析信息要素相关性,出各个基础信息要素间存在的相关,以及相关关系。
,根据所给数据中历年台风发生次数建立台风发生次数模型,并结合最小二乘法拟合图像,在此基础上进行模型优化,使得拟合度最高近年来气旋发生频率呈震荡趋势,最近有所上升,并根据此模型预测发生频率。分析我们发现国家等级划分标准,无法准确评估热带气旋,因此本文引进多项指标作为评定标准首先热带气旋各信息要素进行聚类,从而简化信息要素,再根据简化后各要素对数据聚类,各类的指标其划为四类,接着对所标准与参考资料比对和考证,说明划分标准的可靠性。
关键词:相关性、
1.问题的重述
20世纪是人类历史上物质文明发展最快的世纪,科学技术取得了巨大的进展,数值天气预报的成功也重要展现了社会和科技的进步。但是,经济越发展自然灾害造成的损失就越大,21世纪人类仍将面临频繁发生的自然灾害的威胁,热带气旋是世界上主要的自然灾害之一。在我国, 气象灾害频数占整个自然灾害的70%以上,造成的经济损失占国内生产总值的3%-6%,这一比率比一般发达国家高,而台风灾害在气象灾害中占有相当一部分。
附录1给出了2000-2013年的西北太平洋热带气旋基础信息,附录2给出了2006年修订的热带气旋等级国家标准。
试利用附录1给出的2000-2013年的西北太平洋热带气旋基础信息分析如下问题:
1)西北太平洋热带气旋基础信息要素之间相关吗?若相关,关系如何?
2)近年来西北太平洋热带气旋发生频率在升高吗?2014年西北太平洋上会发生多少个热带气旋?
3)2006年修订的热带气旋等级国家标准还合适吗?若不合适,你认为应该怎样调整?
2.模型的假设
(1)数据真实可靠
(2)精确,能够放映出改的各项指标测量的数据有足够的
3.符号说明
符号 含义 年份 台风发生次数
4.问题的分析
4.1 问题一的分析
问题一是在给定基本,1项基础信息下的的分析,寻找存在关系相关的程度。基础要素之间的和显著性。本文相关和显著性指标对因素逐一分析找存在的求相关关系程度轴与以台风次数为轴坐标轴,在此坐标轴上画出年份与台风次数的散点图,观察并考虑采用最小二乘法拟合图像,即观测值与预测值的差值平方和达到最小。在次基础上改进模型,判断比较回归平方和与总离差平方和的比值介于01之间,越接近1,回归拟合效果越好,一般认为超过0.8的模型拟合度比较高。3 问题三的分析
本文问题三在于讨论问题一的分析,我们发现,国家的等级标准标准过于单一,只最大风速为参考标准,因此本文考虑引进多项因素作为评定标准,从而客观的评定气旋等级首先根据问题一结果,利用将的基础信息要素进行聚类,从而简化信息要素,再利用简化后信息要素将数据资料进行聚类,从而类,并根据每类特点制定等级划分标准再通过历史文献的比对考证,证明划分标准的可靠性。
5.模型的建立与求解
5.1 问题一模型的建立与求解
Step1:Pearson 相关系数
Pearson相关系数用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson 简单相关系数值域等级的解释(见表 1 )
表 1 相关系数和值域等级
等级解释 0.8-1.0 极强相关 0.6-0.8 强相关 0.4-0.6 中等程度相关 0.2-0.4 弱相关 0.0-0.2 极弱相关或无相关 Pearson计算公式:
展开得:
其中、代表各个基础信息要素代表各个基础信息要素Pearson系数。
Step2:显著性水平P检验
显著性的含义是指两个群体的态度之间的任何差异是由于系统因素而不是偶然因素的影响。我们假定控制了可能影响两个群体之间的差异的所有其他因素,因此,余下的解释就是我们所推断的因素,而这个因素不能够100%保证,所以有一定的概率值,叫显著性水平。显著性水平是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用表示。显著性是对差异的程度而言的,程度不同说明引起变动的原因也有不同:一类是条件差异,一类是随机差异。它是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。
P值的理解:假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业
您可能关注的文档
最近下载
- 2022年注册测绘师法律法规重点记忆手册.pdf
- 玻璃雨棚施工方案.docx VIP
- 四川省达州市大竹县中考二模数学试题含解析.docx VIP
- 沪教牛津版六年级下册英语沪教牛津版Module4测试卷.docx VIP
- 2024-2025学年度甘肃省合作市中考数学真题分类(一次函数)汇编专项测试练习题(解析版).docx
- (初中数学)典型中考数学动点问题试题专题复习讲解汇总.doc VIP
- 护理读书的报告范文的共篇.doc VIP
- 沪教牛津版六年级下册英语沪教牛津版期末测试卷.docx VIP
- 国家开放大学《建筑工程质量检验》章节测试参考答案.pdf
- 四川省达州市大竹县2025年初三最后一考数学试题试卷含解析.doc VIP
文档评论(0)