第2章 性回归.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 线性回归 §2.1 线性回归基本概念 2.1.1 回归分析所要解决的主要问题 2.1.2 统计关系与函数关系 2.1.3 相关分析与回归分析 2.1.4 随机误差项 回归分析,是确定两个或两个以上变量间的数量相互依赖关系的一种统计分析方法,运用十分广泛。 父亲们的身高与儿子们的身高之间 关系的研究 1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式 一般来说,回归分析是根据已掌握的变量实测数据建立适合的回归模型,然后求解模型中的各个参数,评价回归模型是否能够很好地拟合实测数据;如果能够很好的拟合,则可以根据自变量的变化情况对因变量作进一步的预测与控制。 在回归分析中,如果模型只包括一个自变量、一个因变量,且二者的数量关系可用一条直线近似表示,则称为一元线性回归分析。Y=a+bX 2.1.1 回归分析所要解决的主要问题 (1)确定几个特定变量之间是否存在相关关系,如果存在的话,找出她们之间合适的数学表达式 (2)根据一个或几个变量的值,预报或控制另一个变量的取值,并且要知道这种预报或控制的精确度 (3)进行因素分析,确定因素的主次以及因素之间的相互关系等等 一元线性回归分析,只要解决: (1)求变量x与y之间的回归直线方程 (2)判断变量x和y之间是否确为线性关系 (3)根据一个变量的值,预测或控制另一变量的取值 2.1.2 统计关系与函数关系 变量之间的关系形态一般可以分为两类:一类为变量之间的关系是确定的,称为函数关系; 而另一类变量之间的关系是不确定的,称为统计关系。 变量之间统计关系,是指一个或几个变量在数量上的变动会引起另一个变量数量上发生变动,但变动的结果不是唯一确定的,亦即变量之间的关系不是一一对应的,因而不能用函数关系进行表达。但统计关系可以通过函数关系加一个随机变量予以描述。 2.1.3 相关分析与回归分析 相关分析就是对两个变量之间线性关系的描述和度量。统计关系的形态大体上可以分为线性相关、非线性相关、完全相关和不相关等几种。 散点图是描述变量之间关系的一种直观的方法,从中可以直观地看出变量之间的关系形态及关系强度。 不同形态的散点图 2.1.3 相关分析与回归分析 通过散点图可以判断两个变量之间有无相关关系,并对变量之间的关系形态做出大致的描述,但散点图不能准确反映变量之间的关系密切程度。 因此,为准确地度量两个变量之间的关系密切程度,需要计算相关系数。 相关系数是对变量之间密切程度的度量。对两个变量之间线性相关程度的度量称为简单相关系数。若相关系数是根据总体全部数据计算出来的,称为总体相关系数 ;若是根据样本数据计算出来的,则称为样本相关系数 。样本相关系数的计算公式为: 2.1.3 相关分析与回归分析 可以证明,相关系数的取值范围在-1到1之间,即 。 值的大小可以用来反映相关关系的强弱程度。 越大,说明相关程度越高,相反, 越小,说明相关程度越低。特别地, 或 时,表明现象之间存在完全相关关系,当 时,说明现象之间完全不相关。对于相关关系的强弱程度,通常有个检验标准可供参考: 时,可认为基本上不存在相关关系; 为低度相关; 为显著相关; 为高度相关。 2.1.3 相关分析与回归分析 相关分析和回归分析的区别 二者的研究目的不同。前者主要研究变量之间是否存在线性关系以及这种关系的强弱程度,而后者则是在前者的基础上进一步研究变量之间的联系方式,以便在给定一个或几个变量值的条件下预测或控制另一个变量的值。 其次,两者的假设条件不同。相关分析假设研究的两个变量是随机的。而回归分析一般都假设解释变量是确定性的,在重复抽样中取固定的值;被解释变量是随机的,它有一个概率分布。回归分析的目的就是要通过给定解释变量的值来预测或控制被解释变量的总体均值或个别值。 2.1.3 相关分析与回归分析 相关分析和回归分析的联系 在进行回归分析之前,一般要确定变量之间的线性关系是否密切,这就要依赖相关分析。 变量之间的相关系数与回归分析中的拟合程度存在一定关系。 2.1.4 随机误差项 随机误差:也称为偶然误差和不定误差,在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差。 它的特点:大小和方向都不固定,也无法测量或校正。 它的性质:随着测定次数的增加,正负误差可以相互低偿,误差的平均值将逐渐趋向于零。 2.1.4 随机误差项 随机误差项的来源 被省略掉

文档评论(0)

baa89089 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档