第十三章一元线性回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
心理统计学 一元线性回归 一元线性回归模型的建立方法 回归模型的检验和估计 回归方程的应用 回归一词的由来 回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。 Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。 变量之间存在关系的两种类型: 确定性关系(函数关系) 不确定性关系(相关关系) 函数关系 是一一对应的确定关系:一个(或多个)确定的自变量的值对应一个确定的因变量的值。 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 相关关系(correlation) 变量间关系不能用函数关系精确表达,是一种不确定性关系。 一个变量的取值不能由另一个变量唯一确定。 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 回归分析与相关分析的区别 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 回归模型的类型 回归分析的模型 数学模型: y = f( x 1 、x 2、?????? 、x k ) + e 因变量Y受到已知k个字变量的影响和一些随机变量的影响。 一组观测数据得到:y i= f( x 1i 、x 2i、?????? 、x k i) + ei 每一组值中,所有x确定,e 未知,因此U也是不确定的。 所有e 服从m=0的正态分布。 对于所有的 y 取平均数 ——回归方程 回归分析的任务 1、建立回归方程 从一组样本数据出发,确定变量之间的数学关系式(自变量的个数,函数形式,估计函数中的参数) 2、检验方程的有效性 对这个关系式的可信程度进行各种统计检验,看方程是否有价值,判断它的有效性高低,对这个方程是否是最佳方程做研究。 3、利用所求出的方程,进行估计、预测和控制 一元线性回归 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一个线性方程来表示 一元线性回归模型 描述因变量 y 如何依赖于自变量 x 和误差项? 的方程称为回归模型 一元线性回归模型可表示为 y = ? + b x + e y 是 x 的线性函数(部分)加上误差项 方程的图示是一条直线,也称为直线回归方程 误差项 ? 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 ? 和 ? 称为模型的参数 ? 是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 ? 是直线的斜率,称为回归系数,表示当 x 每变动一个 单位时,y 的平均变动值 估计的回归方程 (estimated regression equation) 最小二乘法 最小二乘估计 最小二乘法 令: 则: 步骤: 【例】有15个学生,数学和物理成绩列于表内,现想求一个物理成绩对数学成绩的一元回归方程。 解: 回归直线的拟合优度 变差 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响

文档评论(0)

rovend + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档