第一章气象资料整理.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章气象资料整理

第一章、气象资料的整理;第一章1.统计分析与预报方法简介;相应地,三种预测天气和气候变化的方法:;本课程特点;第一章2. 气象资料的表示;2.1单变量资料的表示 对于某一个气象要素,可用x 表示取值,记录下n个时刻的采样数值,可表示为:x1, x2, x3, … xn。 数学上也常用列向量符号来表示该组数据: x=(x1, x2, x3, … xn)T n被称为数据的“样本容量”。 对于连续型的气象要素,能否获得在某时间段内的全部连续取值?;需要厘清的概念: 总体(population)与样本(sample): “总体”: 统计分析对象的全体;一个变量的全部可能取值。“总体”是无限的、未知的。 “样本”:为了了解“总体”的变化规律,对“总体”进行采样,获得“总体”的部分数据,称为“样本”。 “总体”是未知的,我们所研究的气象资料数据都是“样本”。统计分析的目的就是根据“样本”的统计特征去估计“总体”的特征。 “总体”的特征是客观存在的,而“样本”的特征(如平均值、方差)随着“样本”的不同而变化。某个“样本”的统计特征是否能够代表“总体”的统计特征,这需要对该样本的特征进行统计检验。;单变量资料的统计特征;距平(anomaly) 某样本资料中,单个数据与平均值的差称为“距平”,例如第i个数据的距平记为xdi: 距平可正可负,单位和原数据的单位相同,反映个别数据偏离平均值的大小。 将原数据资料转化为距平资料,使其平均值为0,这种处理方法称为:“距平中心化”,对研究问题带来诸多方便,气象研究中常针对距平资料进行分析处理。 ;平均差(mean deviation) 要想反映某个样本数据相对于平均值的离散程度,可以将距平的绝对值求和,然后除以总数n,称为“平均绝对差”或“平均差”,反映该变量的变化幅度。 ;方差(variance)、标准差(均方差;standard deviation) 样本距平资料的平方和的平均值,称为“样本方差”,记为s2:;数据的标准化( Normalization) 气象数据资料都是有单位的,因此不同要素的测量数值及其变化振幅都可能不在同一量级,当研究涉及到多个气象要素时,为了消去因单位量纲不同所造成的影响,常对数据进行标准化,即:将距平资料除以标准差: 设有样本资料:x1, x2, x3, … xn , 标准差为s, 则标准化之后的x数据为: ;协方差(Covariance) 设有两个气象要素x和y,同时观测了n次,得到两组样本数据: x1, x2, x3, …, xn 和 y1, y2, y3, …, yn 则两个样本的协方差记为sxy (或Cov(x,y)):;相关系数(Correlation coefficient) 当用于计算协方差的两个变量是不同的气象要素时,为了消除两变量因单位的不同而对协方差数值所产生的影响,常采用标准化的变量(记为:x*和y*)来计算协方差,即线性相关系数:;图例线性相关系数;几种线性相关情形的散点图举例;等级相关系数(斯皮尔曼(spearman)秩相关系数;秩相关系数; Spearman’s rank correlation coefficient) 前文所讲的是线性相关系数,又被称为“皮尔逊(Pearson)线性相关系数”,适用于符合正态分布的数据(大多数情形)。否则,就需要采用等级(秩)相关系数rs。 计算方法: 将原始数据x和y分别从小到大(或从大到小)排列,把排列后各数据的位置序号(称为”秩次”)作为新的秩数据x2, y2,然后对秩数据计算x2和y2的皮尔逊线性相关系数。例如:;当变量中有数据相同时,用他们排列后位置序号的平均值作为秩次。例如;对Spearman等级相关系数的理解;2.2 多个变量的资料整理;资料矩阵的统计特征;协方差矩阵 为了表示m个变量之间的两两相互关系,可计算m个变量的协方差阵S。 先计算X的距平资料阵:Xd,需要用到均值向量,;相关系数阵;第一章3. 统计检验方法;相关系数的检验 由于随机抽样的原因,即便两个“总体”没有相关(即总体的相关系数ρ=0),某一次采样所算得“样本”的相关系数r也可能不为0,而是具有随机性(数学期望=ρ=0)。因此,作出假设:两个“总体”是相互独立的,不存在相关,即 H0:总体的相关系数ρ=0 那么, 可以构造出统计量t: 该统计量服从自由度为n-2的t分布。;如何衡量概率密度函数“两段很远的位置”? “上α分位点” ;教材P22例7: 检验青岛3月与4月平均气温的样本相关系数r=0.488是否显著,(样本容量n=20) (1): 根据公式1.3-17算得统计量t=2.37; (2): 给定显著性水平α=0.05,根据自由度n-2=18, 查出t的“上0.025分位点”tα/2 =2.10

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档