- 1、本文档共105页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 简单线性回归模型
1
引子:中国旅游业总收入将超过3000亿美元吗?
未来我国旅游需求将快速增长,根据中国政府所制定的
远景目标,到2020年,中国入境旅游人数将达到2.1亿人
次;国际旅游外汇收入580亿美元,国内旅游收入2500亿
美元。到2020年,中国旅游业总收入将超过3000亿美元,
相当于国内生产总值的8%至11%。
(来源:《2008年中国旅行社发展研究咨询报告》)
(参考现状:第一产业占GDP的15%,建筑业占GDP 的7%)
●什么决定性因素能使中国旅游业总收入超过3000亿美元?
●旅游业的发展与这种决定性因素的数量关系究竟是什么?
●怎样具体测定旅游业发展与这种决定性因素的数量关系?
2
需要研究经济变量之间数量关系的方法
显然,对旅游起决定性影响作用的是“中国居民的收
入水平”以及“入境旅游人数”等因素。
“旅游业总收入”(Y)与“居民平均收入”(X1)或
者“入境旅游人数”(X2)有怎样的数量关系呢?
能否用某种线性或非线性关系式 Y= f ( X ) 去表现这
种数量关系呢? 具体该怎样去表现和计量呢?
为了不使问题复杂化, 我们先在某些标准的(古典的)
假定条件下,用最简单的模型,对最简单的变量间数
量关系加以讨论
第一节 回归分析与回归函数
一、相关分析与回归分析
(对统计学的回顾)
1、经济变量之间的相互关系
性质上可能有三种情况:
◆确定性的函数关系
Y=f (X)
可用数学方法计算
◆不确定的统计关系—相关关系
Y= f(X)+ε
(ε为随机变量)
不用分析
4
2、相关关系
◆ 相关关系的描述
最直观的描述方式——坐标图(散布图、散点图))
25
20
15
10
5
0
0
2
4
6
8
10
12
25
20
15
10
5
0
0
2
4
6
8
10
12
函数关系
11.2
11
10.8
10.6
10.4
10.2
10
0
2
4
6
8
10
相关关系(线性)
35
30
25
20
15
10
5
0
0
5
10
15
相关关系(非线性)
没有关系
5
相关关系的类型
●
从涉及的变量数量看
简单相关
多重相关(复相关)
●
从变量相关关系的表现形式看
线性相关——散布图接近一条直线
非线性相关——散布图接近一条曲线
●
从变量相关关系变化的方向看
正相关——变量同方向变化,同增同减
负相关——变量反方向变化,一增一减
●
从变量相关的程度看
完全相关、不相关、不完全相关
6
6
3、相关程度的度量—相关系数
如果 X 和 Y 总体的全部数据都已知, X 和 Y 的方差和
协方差也已知,则
Cov( X , Y )
X和Y的总体线性相关系数: ???
Var ( X )Var (Y )
其中: Var( X ) -----X 的方差Var(Y ) -----Y的方差
Cov( X , Y ) -----X和Y的协方差
●总体相关系数只反映总体两个变量
X 和 Y 的线性相关程度
●对于特定的总体来说,
数
??是客观存在的特定数值。
X 和 Y 的数值是既定的,总体相关系
●总体的两个变量
X 和 Y 的全部数值通常不可能直接观测,所
7
以总体相关系数一般是未知的。
X和Y的样本线性相关系数:
X 和 Y 的样本观测值,则X和Y的样本线性
____??( X i ??X )(Yi ??Y )
相关系数为: r ?
???XY
____
22
??( X i ??X ) ??(Yi ??Y )
X其中: i 和 Yi 分别是变量X和Y的样本观测值,
__
X 和 Y 分别是变量 X 和Y 样本值的平均值
__
注意:
rXY
是随抽样而变动的随机变量。
相关系数较为简单, 也可以在一定程度上测定变量
间的数量关系,但是对于具体研究变量间的数量规律
性还有局限性。
8
对相关系数的正确理解和使用
●
X和Y 都是相互对称的随机变量, rXY
??rYX
● 线性相关系数只反映变量间的线性相关程度,不
能说明非线性相关关系
● 样本相关系数是总体相关系数的样本估计值,由
于抽样波动,样本相关系数是随抽样而变动的随机变量,
其统计显著性还有待检验
9
4、回归分析
回归的古典意义:
高尔顿遗传学的回归概念
( 父母身高与子女身高的关系)
子女的身高有向人的平均身高回归的趋势
回归的现代意义:
一个被解释变量对若干个
解释变量依存关系的研究
回归的目的(实质):
由解释变量去估计被解释变
量的平均值
10
明确几个概念(为深刻理解“回归”)
●被解释变量Y的条件分布和条件概率:
当解释变量X取某固定值时
文档评论(0)