网站大量收购独家精品文档,联系QQ:2885784924

第二章 一元线性回归模型 .ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 线性回归的基本思想:双变量模型 上海立信会计学院 * * 双变量回归模型(或一元线性回归模型)与多元线性回归模型 下面的模型为一元线性回归模型; 而如下模型(随机总体回归函数)则是一个多元线性回归模型: 注意:本章介绍的普通最小二乘法只是针对一元线性回归模型 其中,X为自变量,Y为应变量。 本章主要内容: 总体回归函数 样本回归函数 普通最小二乘法 一、总体回归函数 1.回归的含义 回归分析用于研究一个变量(被称为解释变量或应变量)与另一个或多个变量(称为解释变量或自变量)之间的相关关系。它能帮助我们从一个变量取得的值去估计另一个变量所取得值。 设随机变量y与x之间存在某种相关关系。这里,x是可以控制或可以精确观察的变量,换句话说我们可以随意指定n个值 ,因此我们干脆不把x看成是随机变量,而将它看作普通的变量。由于y是随机变量,对于x的每一确定值,y有它的分布。若y的数学期望存在,而且其取值随x的取值而定,即y的数学期望是x的函数,则称为y关于x回归。 2.总体回归函数 用一个例子来说明什么叫总体回归函数和样本回归函数。 假定经济理论认为博彩支出决定于居民的收入水平。我们用Y表示每周博彩支出,X代表每周个人可支配收入(税后收入,PDI),单位是美元。现在假设有100个人参与博彩(总体),根据PDI水平分为10类。详细数据见下表。  根据下表可以绘制散点图。  散点图表明每个X对应一个Y总体,本例中有10个子总体。在散点图中,把每个随机变量 的期望值连接起来,得到的直线称为总体回归线。总体回归线给出了与自变量(可支配收入)的每个取值相应的应变量的均值,或者说,总体回归线表明了Y的均值与每个X的变动或对应关系。 每周博彩支出和每周个人可支配收入 每周博彩支出和每周个人可支配收入 假定X与Y的均值之间为线性关系,则可以表示成如下函数关系: 上式称为确定或非随机总体回归函数(PRF)。其中, 、 称为参数或回归系数(regression coefficients)。准确地讲, 称为截距, 称为斜率。斜率度量了X每变动一单位,Y均值的变化量。B1是当X为0时Y的均值。 注意:回归分析关注的是在给定自变量条件下应变量的变化,因此,严格地说,回归分析是条件回归分析。但为了简略起见,表达式   常简写为  。  3.总体回归函数的统计或随机设定  对于个体消费者来说,可以用下式来表示博彩支出与收入之间的关系: 表示随机误差项 上式称为随机或统计总体回归函数。可以看得出来,对于每一个人(单个观察值)来说,在某个PDI水平上,其博彩支出可以分为两部分:一是    ,即这个人所处的子总体的平均博彩支出。这一部分称为系统或确定性成分。二是 ,称为非系统或随机成分,随机项也称为噪声部分,它是诸多随机因素的综合体。那么, 具体包含哪些内容呢?      4.随机误差项的性质 (1)误差项代表了未纳入模型的变量的影响。 (2)人类行为的内在随机性。 (3)U还代表了度量误差。 (4)即使知道其他变量可能会对Y有影响,这些变量的综合影响是有限的,非随机的,考虑到模型的简化性,可以把这些次要因素归入随机项u。    二、样本回归函数 很多时候,我们得不到总体数据,而只能得到一个样本。还是以博彩一例为例子,假设我们得不到总体数据而只得到了一个样本,见下表: 博彩一例的随机样本1 博彩一例随机样本1的样本回归线 SRL1 假如可以通过一种方法在散点图中得到一条直线,并认为这条直线就是总体回归线的好的估计,称这条直线叫做样本回归线(SRL)。与样本回归线对应的样本回归函数(SRF),如下: 其中, 表示总体条件均值 的估计量; 为 的估计量; 为 的估计量。 从散点图可以看出,并非所有的样本数据落在这一条样本回归线上。这样,每一个样本点的Y值等于估计值加上一个偏差,如下: 上式称为随机样本回归函数。其中, 是 的估计量,称为残差项,简称残差(residual)。 产生的原因与 的产生原因相同。 根据以上两式,可以知道: 为了清楚起见,我们将总体回归函数和样本回归函数放在一起,将总体回归直线和样本回归直线放在同一个坐标图中,如下: 总体回归线和样本回归线 专题:“线性”回归的特殊含义 1.变量线性 变量线性是指应变量的条件均值是自变量的线性函数。例如: 2.参数线性 应变量的条件均值是参数B的线性函数,而变量之间并不一定是线性的。即参数B是以一次方的形式出现。 注意:本书即关注变量线性模型又关注参数线性模型 *

您可能关注的文档

文档评论(0)

别拿青春赌明天 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档