网站大量收购闲置独家精品文档,联系QQ:2885784924

实验数据分析方法课件.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验数据分析方法课件

第二部分 实验数据的统计分析 第五章 误差理论与最小二乘法 第六章 回归分析 第七章 多变量分析 第八章 功率谱与周期分析;第六章 回归分析; 虽然统计相关关系和函数关系(变量间的关系完全是确定的)是两种不同类型的变量关系,但它们之间也不是一成不变的:一方面,在理论上有函数关系的几个变量由于观测误差的影响,每次测得变量的数值之间并不是准确的满足这种函数关系,造成某种不确定性;另一方面,当人们对事物的规律性了解得更加深入时,相关关系又可能转化为函数关系。事实上,自然科学中的许多定理、公式正是通过对研究对象的大量观测数据的分析处理,通过总结和提高得到的。 回归分析就是利用大量的观测数据来确定变量间的相关关系的一种数学方法。在观测天文学中,回归分析常被用来定量描述某一研究对象两个特征量之间的显式关系;校准和量化对宇宙大尺度结构研究极其重要的“宇宙距离尺度”;在激光测月的资料处理中,回归分析也起了很重要的作用。 ;总的来说,回归分析所要解决的主要问题是: 1、从一组数据出发,确定这些变量之间的数学表达式——回归方程或经验公式; 2、对回归方程的可信程度进行统计检验; 3、进行因素分析,例如从对共同影响一个变量的许多变量(因素)中,找出哪些是重要因素、哪些是次要因素。; 在许多情况下,两个变量之间的相关关系呈线性关系,它是统计相关关系中最简单的一种,也是天文上实际问题中最常见的情况。我们的目的则是要找出能描述这两个变量之间的线性相关关系的定量表达式。 对于两个大致成线性关系的变量y和x,通常用如下的回归模型来描述它们之间的线性相关关系: ;设由观测得到y,x的N组数据(yk,xk),k=1―N,代人上式得: 对误差项?k,规定E(?k)=0,?2(?k)=?2,当k≠j时,?k与?j不相关,即协方差cov(?k,?j)=0。 鉴于对随机误差项?k的上述规定,不难得知因变量yk是随机变量,它们都来自均值E(yk)=?0+?xk 。方差为?2的概率分布,且任何两个观测值之间是互不相关的。 上面我们对?k的分布没有作任何规定,无论?k具有什么样的分布函数,我们都可以使用最小二乘法求得参数?0,?的估计值。但是在进行区间估计和检验时,需要对?k的分布函数的形式作出假设,通常的假设是误差项?k~N (0,?2),即?k服从均值为0、方差为?2的正态分布。因为误差项通常代表模型中略去的许多因素的影响,这些因素在一定范围内影响因变量取值,并且随机的变化:依中心极限定理,它们近似服从正态分布。;当假设误差项?k为正态分布时,上述模型被称为正态误差回归模型。下图给出了正态误差回归模型的图示: 对于形如前式的模型,回归分析的任务是找到回归参数?0,? 的“好”的估计量,从而得到一条最能描述y和x关系的回归直线(见上图中的直线),它的方程可表为:;下面我们利用最小二乘准则给出b0,b 的计算公式: 由最小二乘原理,b0, b应该是满足残差 平方和最小的解,记 则利用Q=min可得正规方程组: 解之可得:; 其中 在给定参数估计值b, b0后,可得到相应的回归方程(或回归函数)为: 由于yk是均值为 方差为?2的随机变量,对上述正规方程组及其解的形式稍加改变,并利用概率统计知识,可以得到: ; 在前一小节中,我们在两个变量大致成线性关系的假定下,利用最小二乘法得到了描述这两个变量相关关系的回归直线方程。就这种数学方法本身而言,可以不加任何条件的约束:对任一组数据(xk,yk),k=1-N,都可由回归方程组求出一组b0,b, 从而得到一条回归直线。但并非对每一组数据配的回归直线都有实际意义:例如对平面上分布完全杂乱无章的散点所配的直线就毫无意义。因此,通常在求得直线回归方程以后必须进行检验,判别所配直线是否有实际意义。如果检验结果回归方程是显著的,则表明所配回归直线揭示了因变量y与自变量x之间有较强的线性相关性;如果检验结果回归方程不显著,则表明所配回归直线没有实际意义。 衡量回归效果好坏的标准 ;将总平方和进行分解,有: 上式右边第一项是观测值与回归值之差的平方和,也就是残差平方和,有时也称它为剩余平方和,用Q表示。Q又可表为: — 它是除了x对y的线性影响之外的一切因素(包括x对y的非线性影响)对y值变化的影响。 上式右边第二项是回归值?与平均值 之差的平方和,我们称它为回归平方和,并记为U:; 即; 并且,当?=O成立时回归平方和与剩余平方和是相互独立的。故构成如下的统计量: 因总平方和lyy的自由度F总=FU +FQ ,所以统计量F是服从第一自由度为l,第二自由度为N―2的F分布。;F检验的步骤可归纳如下:

文档评论(0)

gm8099 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档