线性回归分析要点.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一元线性 回归分析 一元线性回归模型 默认的假设 1、 y依x而变化,但x不依y变化。 若y与x呈因果关系,则y表示结果变量,x表示原因变量,该假设说明的是:该因果关系是单向的,故建立的模型为“单一方程式模型”。 否则需建立“联立方程式模型”。 2、y与x是相关关系。 建立的模型为随机性模型,即模型中含有随机变量ε。 否则,建立的模型为确定性模型。此时,y与x是函数关系。 3、 y与x是线性关系。 建立的模型为线性模型。(用线性方程式表示) 否则,需建立非线性模型。(用非线性方程式表示) 4、y与x为同期值。 建立的模型为静态模型。 否则,需建立动态模型,如分布滞后模型、自回归模型等。 5、y为随机变量,而x为确定性变量,且无测量误差。 说明模型分析的对象是y。 需确定y的概率分布。 6、y与x均为数值型变量。 若x为品质型变量,则需建立虚拟变量模型。 若y为品质型变量,则需建立Probit模型或Logistic模型。 7、模型中随机误差项ε的期望为0。 说明模型中的x变量是影响y变化的主要因素。 次要因素和随机因素对y的影响通过随机误差项ε来反映。 次要因素和随机因素对y的影响有正有负,正负抵消,故随机误差项ε的期望为0。 8、模型中随机误差项ε的方差为常量σ2。 σ2的值不随x的取值变化而变化。 目的是为了用x的变化来解释y的变化。 视x的不同取值对y的影响程度是相同的。 9、模型中的随机误差项ε服从正态分布,即 。 该假定的依据是中心极限定理。 目的是确定y的分布。 10、模型中的参数(回归系数)β0、β1为确定值。 建立的模型为固定参数模型。 否则,需建立变参数模型。 一元线性回归方程 一元线性回归模型与方程的含义 一元线性回归模型反映的是:y与x不确定的真实关系。 一元线性回归方程反映的是:y的期望值(平均值)与x确定的函数关系,即y随x变化的统计规律。 经典假设(Gauss-Markov假设) 1、模型设定无偏误。 模型的函数表达式合适。 模型中既没有遗漏重要的解释变量(所以,随机误差项ε无异方差或自相关),又没有列出不重要的解释变量(没有损失自由度,能达到参数估计的精度要求)。 2、 有此假设,才能得到 说明随机误差项ε中,只有随机因素,即没有遗漏对y产生重要影响的解释变量。 3、 有此假设,才能得到 4、 有此假设,才能得到 说明在模型中,除x以外,对y产生影响的因素是完全随机、相互独立、互不相关的。既无自相关现象。 5、 有了这一假定,才能把x与x以外的因素对y的影响严格区分开来,以便用x来解释y的变化。 说明x为非随机变量。 经典假设的概括 为非随机变量, 为独立的随机变量,且 。 多元线性回归模型 多元与一元的区别 1、自变量有多个 多个自变量之间的关系需考虑 每个xi与y的关系需考虑 所有的x与y 的关系还需考虑 若 相关,则需路径分析。以便从xi 与y的相关系数中,分离出xi对y的直接效应与间接效应,从而确定对xi的取舍。 路径分析模型 y关于x的路径图的解读(p=3) 路径系数的含义与作用 1、路径系数的含义 路径系数是路径分析模型的回归系数,有标准化系数和非标准化系数之分。 一般情况下,路径系数是指路径分析模型中标准化的系数,即将所有观测变量都标准化后的回归系数 xi对y的效应分解 在路径分析中,具有因果关系的变量,在计算协方差时,通常将可测变量标准化。这样,得到的协方差就是相关系数。 为了弄清变量之间如何作用,通常将相关系数进行分解,分成总效应、直接效应和间接效应。 1、直接效应 反映原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,其大小等于原因变量到结果变量的路径系数。如 等。 2、间接效应 反映原因变量通过一个或多个中间变量对结果变量所产生的影响。 如果只有一个中间变量,间接效应是两个路径系数的乘积;如果中间变量不止一个,间接效应是所有从原因变量出发,通过所有中间变量结束于结果变量的路径系数乘积。如 多元与一元的区别 2、经典假设中,多了一条 无多重共线性。 中没有一个可用其他的k-1个x代替。此时,模型为最简单的模型,参数估计的成本最低。 3、回归模型有三种不同的表现形式。 4、回归系数和判定系数的称呼和意义的不同。 称为偏回归系数,意味其他x不变时, xi对y的影响程度。 称为复判定系数,反映y的变化中,所

文档评论(0)

6663144 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档