第一章气象资料整理.pptxVIP

下载本文档

29
0
约3.02千字
约 41页
2018-09-18 发布于浙江
举报
版权申诉

第一章气象资料整理.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一章气象资料整理

第一章、气象资料的整理;第一章1.统计分析与预报方法简介;相应地，三种预测天气和气候变化的方法：;本课程特点;第一章2. 气象资料的表示;2.1单变量资料的表示对于某一个气象要素，可用x 表示取值，记录下n个时刻的采样数值，可表示为：x1, x2, x3, … xn。数学上也常用列向量符号来表示该组数据： x=(x1, x2, x3, … xn)T n被称为数据的“样本容量”。对于连续型的气象要素，能否获得在某时间段内的全部连续取值？;需要厘清的概念: 总体(population)与样本(sample)： “总体”：统计分析对象的全体；一个变量的全部可能取值。“总体”是无限的、未知的。 “样本”：为了了解“总体”的变化规律，对“总体”进行采样，获得“总体”的部分数据，称为“样本”。 “总体”是未知的，我们所研究的气象资料数据都是“样本”。统计分析的目的就是根据“样本”的统计特征去估计“总体”的特征。 “总体”的特征是客观存在的，而“样本”的特征（如平均值、方差）随着“样本”的不同而变化。某个“样本”的统计特征是否能够代表“总体”的统计特征，这需要对该样本的特征进行统计检验。;单变量资料的统计特征;距平(anomaly) 某样本资料中，单个数据与平均值的差称为“距平”，例如第i个数据的距平记为xdi：距平可正可负，单位和原数据的单位相同，反映个别数据偏离平均值的大小。将原数据资料转化为距平资料，使其平均值为0，这种处理方法称为：“距平中心化”，对研究问题带来诸多方便，气象研究中常针对距平资料进行分析处理。 ;平均差(mean deviation) 要想反映某个样本数据相对于平均值的离散程度，可以将距平的绝对值求和，然后除以总数n，称为“平均绝对差”或“平均差”，反映该变量的变化幅度。 ;方差(variance)、标准差（均方差；standard deviation）样本距平资料的平方和的平均值，称为“样本方差”，记为s2：;数据的标准化( Normalization) 气象数据资料都是有单位的，因此不同要素的测量数值及其变化振幅都可能不在同一量级，当研究涉及到多个气象要素时，为了消去因单位量纲不同所造成的影响，常对数据进行标准化，即：将距平资料除以标准差：设有样本资料：x1, x2, x3, … xn ，标准差为s, 则标准化之后的x数据为： ;协方差(Covariance) 设有两个气象要素x和y，同时观测了n次，得到两组样本数据： x1, x2, x3, …, xn 和 y1, y2, y3, …, yn 则两个样本的协方差记为sxy （或Cov(x,y)）:;相关系数(Correlation coefficient) 当用于计算协方差的两个变量是不同的气象要素时，为了消除两变量因单位的不同而对协方差数值所产生的影响，常采用标准化的变量(记为：x*和y*)来计算协方差，即线性相关系数：;图例线性相关系数;几种线性相关情形的散点图举例;等级相关系数（斯皮尔曼(spearman)秩相关系数；秩相关系数; Spearman’s rank correlation coefficient）前文所讲的是线性相关系数，又被称为“皮尔逊（Pearson）线性相关系数”，适用于符合正态分布的数据（大多数情形）。否则，就需要采用等级(秩)相关系数rs。计算方法：将原始数据x和y分别从小到大（或从大到小）排列，把排列后各数据的位置序号(称为”秩次”)作为新的秩数据x2, y2，然后对秩数据计算x2和y2的皮尔逊线性相关系数。例如：;当变量中有数据相同时，用他们排列后位置序号的平均值作为秩次。例如;对Spearman等级相关系数的理解;2.2 多个变量的资料整理;资料矩阵的统计特征;协方差矩阵为了表示m个变量之间的两两相互关系，可计算m个变量的协方差阵S。先计算X的距平资料阵：Xd，需要用到均值向量，;相关系数阵;第一章3. 统计检验方法;相关系数的检验由于随机抽样的原因，即便两个“总体”没有相关（即总体的相关系数ρ=0），某一次采样所算得“样本”的相关系数r也可能不为0，而是具有随机性(数学期望=ρ=0)。因此，作出假设：两个“总体”是相互独立的，不存在相关，即 H0：总体的相关系数ρ=0 那么，可以构造出统计量t：该统计量服从自由度为n-2的t分布。;如何衡量概率密度函数“两段很远的位置”？ “上α分位点” ;教材P22例7：检验青岛3月与4月平均气温的样本相关系数r=0.488是否显著，（样本容量n=20） (1): 根据公式1.3-17算得统计量t=2.37； (2): 给定显著性水平α=0.05，根据自由度n-2=18, 查出t的“上0.025分位点”tα/2 =2.10