- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章气象资料整理
第一章、气象资料的整理;第一章1.统计分析与预报方法简介;相应地,三种预测天气和气候变化的方法:;本课程特点;第一章2. 气象资料的表示;2.1单变量资料的表示
对于某一个气象要素,可用x 表示取值,记录下n个时刻的采样数值,可表示为:x1, x2, x3, … xn。
数学上也常用列向量符号来表示该组数据:
x=(x1, x2, x3, … xn)T
n被称为数据的“样本容量”。
对于连续型的气象要素,能否获得在某时间段内的全部连续取值?;需要厘清的概念: 总体(population)与样本(sample):
“总体”: 统计分析对象的全体;一个变量的全部可能取值。“总体”是无限的、未知的。
“样本”:为了了解“总体”的变化规律,对“总体”进行采样,获得“总体”的部分数据,称为“样本”。
“总体”是未知的,我们所研究的气象资料数据都是“样本”。统计分析的目的就是根据“样本”的统计特征去估计“总体”的特征。
“总体”的特征是客观存在的,而“样本”的特征(如平均值、方差)随着“样本”的不同而变化。某个“样本”的统计特征是否能够代表“总体”的统计特征,这需要对该样本的特征进行统计检验。;单变量资料的统计特征;距平(anomaly)
某样本资料中,单个数据与平均值的差称为“距平”,例如第i个数据的距平记为xdi:
距平可正可负,单位和原数据的单位相同,反映个别数据偏离平均值的大小。
将原数据资料转化为距平资料,使其平均值为0,这种处理方法称为:“距平中心化”,对研究问题带来诸多方便,气象研究中常针对距平资料进行分析处理。 ;平均差(mean deviation)
要想反映某个样本数据相对于平均值的离散程度,可以将距平的绝对值求和,然后除以总数n,称为“平均绝对差”或“平均差”,反映该变量的变化幅度。
;方差(variance)、标准差(均方差;standard deviation)
样本距平资料的平方和的平均值,称为“样本方差”,记为s2:;数据的标准化( Normalization)
气象数据资料都是有单位的,因此不同要素的测量数值及其变化振幅都可能不在同一量级,当研究涉及到多个气象要素时,为了消去因单位量纲不同所造成的影响,常对数据进行标准化,即:将距平资料除以标准差:
设有样本资料:x1, x2, x3, … xn , 标准差为s, 则标准化之后的x数据为:
;协方差(Covariance)
设有两个气象要素x和y,同时观测了n次,得到两组样本数据:
x1, x2, x3, …, xn 和 y1, y2, y3, …, yn
则两个样本的协方差记为sxy (或Cov(x,y)):;相关系数(Correlation coefficient)
当用于计算协方差的两个变量是不同的气象要素时,为了消除两变量因单位的不同而对协方差数值所产生的影响,常采用标准化的变量(记为:x*和y*)来计算协方差,即线性相关系数:;图例线性相关系数;几种线性相关情形的散点图举例;等级相关系数(斯皮尔曼(spearman)秩相关系数;秩相关系数; Spearman’s rank correlation coefficient)
前文所讲的是线性相关系数,又被称为“皮尔逊(Pearson)线性相关系数”,适用于符合正态分布的数据(大多数情形)。否则,就需要采用等级(秩)相关系数rs。
计算方法:
将原始数据x和y分别从小到大(或从大到小)排列,把排列后各数据的位置序号(称为”秩次”)作为新的秩数据x2, y2,然后对秩数据计算x2和y2的皮尔逊线性相关系数。例如:;当变量中有数据相同时,用他们排列后位置序号的平均值作为秩次。例如;对Spearman等级相关系数的理解;2.2 多个变量的资料整理;资料矩阵的统计特征;协方差矩阵
为了表示m个变量之间的两两相互关系,可计算m个变量的协方差阵S。
先计算X的距平资料阵:Xd,需要用到均值向量,;相关系数阵;第一章3. 统计检验方法;相关系数的检验
由于随机抽样的原因,即便两个“总体”没有相关(即总体的相关系数ρ=0),某一次采样所算得“样本”的相关系数r也可能不为0,而是具有随机性(数学期望=ρ=0)。因此,作出假设:两个“总体”是相互独立的,不存在相关,即
H0:总体的相关系数ρ=0
那么, 可以构造出统计量t:
该统计量服从自由度为n-2的t分布。;如何衡量概率密度函数“两段很远的位置”? “上α分位点” ;教材P22例7:
检验青岛3月与4月平均气温的样本相关系数r=0.488是否显著,(样本容量n=20)
(1): 根据公式1.3-17算得统计量t=2.37;
(2): 给定显著性水平α=0.05,根据自由度n-2=18, 查出t的“上0.025分位点”tα/2 =2.10
原创力文档


文档评论(0)