网站大量收购独家精品文档,联系QQ:2885784924

《数理统计方法教学课件》第9章 回归分析.pptx

《数理统计方法教学课件》第9章 回归分析.pptx

  1. 1、本文档共103页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章回归分析§9.1相关性及其检验§9.2线性回归分析§9.3多元线性回归分析§9.1相关性及其检验科学研究的任务就是找出变量间的相互关系及变化规律。变量之间的关系通常分为两类:一类是非确定性关系,包括线性和非线性两种;另一类则是函数关系。相关关系:假设存在两个随机变量X和Y,若对任一变量的每一个可能取值,另一随机变量都有一个确定的分布与之对应,则称这两个随机变量间存在相关关系。回归关系:假设X是非随机变量或随机变量,Y是随机变量,若对于X的每一个确定取值,Y都有的一个确定分布与之对应,那么称随机变量Y对变量X存在回归关系。☆相关关系中的两个变量其地位是对称的,两者可以互为因果关系;★回归关系中X称为自变量或解释变量,而Y则称为为因变量或响应变量,两者存在单一的因果关系。研究两个随机变量关系时,通常先要做一个散点图直观地描述一下两个变量之间的关系。即用自变量为横轴,因变量Y为纵轴,在平面内标出各个数据对:图示的方法也可以应用到指纹图谱或者微阵列的形式。就是提取一系列的指标,然后将这些指标归一化为统一的取值域,这样一个对象就用一个图谱来表示。其实,这就是一个数据变换的思路。相关关系的分类相关关系按照所涉及的因素分为:单相关:两变量间的相关关系;复相关:三个(或以上)变量间的相关关系;相关关系按照表现形态分为:直线相关:观察点的分布大致呈现为一条直线;曲线相关:观察点的分布大致呈现为一条曲线。相关关系的分类相关关系按照相关的性质分为:正相关:两个变量大体上呈现同方向变化;负相关:两个变量大体上呈现反方向变化。相关关系的分类背景:维多利亚时代的英格兰统计学家们受到将遗传定量化这一思想的强烈吸引,并为追寻此目的收集了大量数据。Pearson进行了家庭成员间相似性的研究。他将1078对父亲及成年儿子的身高用如下的散点图表示:散点图象一块形如橄榄球的云,边缘上的点很少,并且向右上方倾斜,呈线性增长趋势。结论:较高的父亲一般有较高的儿子。父亲和儿子的身高之间存在着一个正相关的关系。当散点图局限于较小区间时并不能很好地判断其是否为线性形式,因此必须对趋势项有着明确的判断才能进行统计判决。为了判断线性趋势项,必须要剔除各种干扰因素的影响。(线性)相关系数的定义其中:样本相关系数是的相合估计。相关系数的理解相关系数的理解相关系数是变量之间线性相关或围绕直线群集程度的一种度量。相关系数的性质(1)绝对值的大小表示线性相关的强弱程度,其数值满足:完全相关负相关不相关正相关相关系数的性质(2)相关系数是没有单位的纯数值。若某一个变量的所有值都乘以同一负的数值,相关系数变号。相关系数的性质(3)在各种变换下的不变性:两个变量的顺序变换;两个变量的线性变换。两个变量的相似变换相关的图例相关性与因果性统计推断得到的相关关系不能错误地解释为因果关系。因果关系是一种有方向的相关关系,不仅仅是一种相互作用。两个因素间即使没有因果关系,也可能会表现出虚假的相关;两个因素之间即使有因果关系,也可能会表现出虚假的独立性。相关系数通过两个随机变量间乘积的正负号相互抵消作用表达两个变量之间的相关关系。那么,可以判断这种相关关系可以适用于单调的变化关系,如正关系和负关系等。问题:如何检测一组数据存在相关关系,如果数据明显是非线性的。例如,数据就是呈现一段圆弧。相关系数可通过对原来的变量进行函数变换的方法得到一系列拟线性相关系数,这样本质上就成了非线性相关系数了。所以线性与非线性的差别基于所讨论的空间不同。对于非线性的相关系数,可以采用分段线性(泰勒展开式)计算线性系数的方法。这实际是引入一系列的指示函数,参数就是分段的数目。还可以用函数系来变换,求解拟线性相关系数,扩展的相似性原则。相关系数的假设检验实际中常用样本相关系数r来估计总体相关系数。但r的具体取值并不能完全说明变量之间是否有严格的相关关系,这就要求我们作检验以判别是否等于0。的r检验原假设:;备择假设:。现计算r检验统计量,则有:当统计量r大于临界值时,则以显著性水平拒绝原假设。原假设:;备择假设:。现计算t检验统计量,则有:查表并判断。的t检验例题:现在对紫草含量进行测定,测得其浓度c与测得积分值h的数据如下表,试计算相关系数r并作检验。§10.2线性回归方程当我们已经判定两个变量之间存在着显著的线性关系时,由于任意的两个不同的线性关系其线性相关系数都是1,从而我们下面的任务就就是建立具体的函数关系,这就是变量的回归问题。 回归的目的:确立变量之间的函数关系。英国统计学家Galton(1822-1911)和他的学生、现代统计学奠基者Pearson.父辈身高增加一个单位,儿子身高仅增加半个单位左右;父辈身高减少一个单位,儿子身高仅减少半个单位左右;即子代的平均高度向中心回归“回归”的由来一元回归,多元回归,多重

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档