- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例2回归与回归分析
例2.1 回归线与回归函数
假定某个国家的家庭数(总体)由60户组成,即总体为60户,所要研究的问题是,家庭消费支出与家庭可支配收入的关系。用X表示收入,Y表示消费,即对于已知的每周各个家庭收入(X)的数据,要预测总体的消费(Y)支出。假定将收入不等的家庭分为10组,这10组构成了总体即60户家庭的消费。
表2.1 X为每周家庭收入,总体:Y为所有家庭每周消费支出
X
Y 80 100 120 140 160 180 200 220 240 260 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 - 88 - 113 125 140 - 160 189 185 - - - 115 - - - 162 - 191
条件均值 325
(÷5
=65) 462((÷6=77) 445(÷5=89) 707
(÷7
=101 678(÷6=113) 750(÷6=125) 685(÷5=137) 1043(÷7=149) 966(÷6=161) 1211(÷7=173)
表2.1,周收入为80美元的家庭有5户,这5户的每周消费支出分别为55,60,65,70,75.类似地,每周240美元的家庭有6户,其消费支出由150至189不等,这样,表2.1的列给出的是,对应不同的收入水平,其消费支出的条件分布。所谓条件,是指给定收入水平,如第一列,给定收入水平为80,在这一收入水平下,消费支出分别为为55,另一户为60,还有一户为65,另有一户为70,只有一户为75,于是,这一组数给出了在收入为80下,消费支出的条件(给定收入为80美元)分布,其特点为5户有不同的支出,这个例子用于说明问题的方便。因为表2.1的家庭总数60为假定的家庭总数,而表2.1中Y的数据代表总体即所有家庭的消费支出,即所有不同的收入水平下,所有可能的消费支出。而对于X的不同水平,Y的全体构成了一个子总体,如对于X=80,在这一水平下,Y分别等于55、60、65、70和75共5个不同的值,这即是在X=80的条件下,Y 的条件分布,这5个值构成了一个子总体。类似的,对于X=100、120,….,构成一个相应的子总体。所有子总体构成总体。
条件概率与条件期望。在不同的收入水平下,Y取任一个值的概率即为条件概率,如对于给定收入X=80的条件下,Y共有5个不同的值,条件概率即为Y取任一个值的概率,由于随机样本的特征是Y取每一个值的概率相等,因此在X=80的条件下,Y取每一个值的概率为1/5,即
P(Y=55/X=80)=1/5
类似地,在X=100的条件下,Y共有6个值,所以取任意值的条件概率为1/6,以此类推。
P(Y=60/X=80)=1/5 P(Y=65/X=80)=1/5,
P(Y=70/X=80)=1/5 P(Y=75/X=80)=1/5
进而根据条件概率,我们可计算条件期望(均值),即
相应的,有
,上述所计算的条件均值列入表最下行。但是,从以上可知,随着收入水平的提高,平均消费变化即E(Y/X)呈现出从低至高的趋势,即
65(X=80)――77(X=100)――89(X=120)――101(X=140)―113(X=160)――125(180)――137(X=200)-―149(220)-―161(X=240)-―173(X=260)
将上述条件分布绘作图且将Y的条件均值连接,即有图2.1.
图2.1 总体回归直线
从图2.1可以看出,对应X=80,Y有5个可能的值,但条件均值为E(Y/X=80)=65,在X在不同水平下,将Y的条件均值连起来,构成图2.1中的直线,它所说明的是,对应X的不同水平,Y的条件期望(均值)的变化,由于Y的条件均值是对于给定X的值而对于相应的所有Y的值求条件均值,因此称为总体回归直线(PRL)。注意的是对应X的不同值(如X=80),Y的所有值(在X=80时,Y共有5个)的平均值(期望值)所连接的直线,故称为总体回归线。我们特别说明,这一总体是在假定总体已知时推出的,一般的,我们通常不知总体,在这种条件下,我们实际上是假定总体回归直线,由此导出计象经济学中的假设检验.
一般而言,连接这些Y在给定值下的期望值即条件期望(所形成的线可能为直线,也可能为曲线,我们首先讨论直线,即线性总体。至于曲线即非线性,将是我们以后学习的内容。
PRL
文档评论(0)