- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
82回归分析
概率伦与数醒镜计」
数学的一个重要任务是从数量方面分析、揭示、表达现实世界
中普遍地存在着的变量之间的关系。一般来说,变量之间的关系
可分为两类
1.确定性的函数关系:已知一个(或几个)变量的值,就可以
精确地求出另一个变量的值。如V=4/3zR3,S=Vt
2非确定性的相关关系:几个变量之间存在着密切的关系,但
不能由一个(或几个)变量的值精确地求出另一个变量的值。在
相关关系中至少有一个变量是随机变量。如人的血压与年龄,环
境因子与农作物的产量,树木的直径与高度,人均收入与商品的
销量,商品的价格与消费者的需求量。
回归分析是研究变量之间的相关关系的一种统计方法。回归
regression)这一术语是1886年高尔顿( Galton)研究遗传现
象时引进的。
本章仅简单介绍一元线性回归分析和多元线性回归分标
元线性回归
概率论与数醒说升」
例1以家庭为单位,某商品年需求量与其价格之间的调查数
据如下:
价格x(元)
222.32.52.62833.335
需求量y(500g)53.532.72.42.521.51.212
1.x与y之间是相关关
系,不能用解析表达式
y=f(x)表示。
2.作散点图。发现这
些点分布在一条直线附
近
概率论与数醒说升」
3把y看成是由两部分叠加而成:一是x的线性式/+;二
是由随机因素引起的误差E。于是有
y=bo+Pr+e
4.为估计未知参数o、B1,将观测值(x,y;)代入得
y=B+1+E;(i=1,2,…,n)
假定相互独立,且G;~N0,a-)。称(1)式为线性回归的
数学模型。
、B0,B1的最小二乘估计
即
概率伦与数醒镜计」
设b1分别为界的估计值,
∑(y,-b-bx)=0
b,月=b
即则记则
βyye
b
+b1x;+
e
∑(y,-b-bx)x=0
=bo+b,x
y
整理得
选取b使残差平方和Q最小:
nb+b∑x=∑y
Q=∑2=∑[y-(b+bx)
b∑x+b∑x=∑x
Q
2∑(y-b-bx)=0
称它们为正规(正则)方
Q
2∑(y-b-bx)x=0程。解正规方程得
③⑨@
∑(x-x)-y)
概率论与数醒计
则b
n2xy;-x)C∑y)
bo=y-b,x
得到经验回归方程
∑
y=b+b,x
但当假定
b=y=bx
y =bo+B
记S。=∑(x-x)01-)不成立时,求得的经验回归方程
是无意义的。所以,要检验“
S=∑(y1-)
与x存在线性关系”这一假设
实际上,对任何一组数据都可
以用上述方法配一条直线。因此,
必须判断y与x是否真的存在线性
∑(y1-y)2
相关关系。
◎@
二、回归问题的统计检验
概率伦与数醒镜计」
欲检验假设H6:月1=0
总平方和
回归平方和S=∑(-y)=bS
剩余平方和S=(y-j)2
∑(y-)+(,-现=∑(-9)+∑(-y)2
∑(y-)2+∑(-y)2+2∑(y-)(,一y
即
yy=S+S
Sn/o2-x2(n-1)
于是F=
F(1,n-2)
/a2~x2(
当F(1,n-2)时,拒绝H
S必③@
相关系数R(样本相关系数)
论与数醒镜升
R=、S。/S
R
S
(n-2)R
F
∑(分;-5)=bS
S/(n-2)(1-R2)
F(1,n-2)
F
R
(n+F-2)
查相关系数表得临界值R(n-2),当I|Ra(m-2)时拒绝H0
查F分布表得临界值F(1,n2),当FF0(1,n2)时拒绝H
检验:t=√F~1(n2),当1t(n-2)时拒绝H
三、预报和控制
所谓预报问题,就是问当x=x0时y应取何值。很自然地想到用
b+b
来预报y的真实值y0+B1x0+E,由于y是随机变量,给出v的区
间估计更为合理。通常是在一定的置信度1-a下,给出y的容许
限或v的预报区间。
不难证明,当一元线性回归的基本假定成立时,统计量
t
t(n-2)
分×(
其中,S=√S,/-2)为的估计。
因此,得到的置信度为1-的预报区间为
1(x。-x)
y。±tS1|1+-+
Sd◎@
2将曲线问题线性化
概率伦与数醒镜计」
本节主要介绍一元线性回归分析中将曲线问题线性
化的方法,本节涉及的几条曲线都是初等数学中的常
见曲线,无复杂和困难的地方,故本节内容让同学们
自学,不再赘述。
值得注意的是,模型
y=+Ax+Bx2+月x
是所谓的多项式回归,令
rI=r, C2=r, I,=r
则有
y=Ro+Bx+Br2+ Brr
这就是§10.3中要介绍的多元线性回归问题
◎@
3多元线性回归
概率伦与数醒镜计」
、多元线性回归的数学模型」
设因变量y与P个自变量x1,…,xn之间有线性关系:
Bo +B,x,+A+B
其中e为随机变量,称为随机误差。
将n次观测数据(xn,x12,…,x
原创力文档


文档评论(0)