- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章
回归分析
回归分析的起源
1、回归分析最早是19世纪末期高尔顿(Sir Francis Galton)所发展。
2、高尔顿是生物统计学派的奠基人。
发现1:儿童身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形关系。
1855:《遗传的身高向平均数方向的回归》
发现2:但是有趣的是:通过观察他注意到,尽管这是一种拟合较好的线形关系,但仍然存在例外现象:矮个的人的儿子比其父要高,身材较高的父母所生子女的身高将回降到人的平均身高。换句话说,当父母身高走向极端(或者非常高,或者非常矮)的人的子女,子女的身高不会象父母身高那样极端化,其身高要比父母们的身高更接近平均身高。高尔顿选用“回归”一词,把这一现象叫做“向平均数方向的回归”(regression toward mediocrity)。
虽然这是一种特殊情况,与线形关系拟合的一般规则无关,但“线性回归”的术语仍被沿用下来。作为根据一种变量(父母身高)预测另一种变量(子女身高)的一般名称沿用至今,后被引用到对多种变量关系的描述。《欧美统计学史》
回归分析的抽象化描述
1、研究对象的一个或多个变量的变化会引起另一个或多个变量的变化。
2、将两个对象的关系记为 y = f (x),其中 x 称为自变量,y 称为因变量。
3、找出f的具体形式,并估计准确性。
相关分析包含回归分析,且需找出变量间的相关关系
商品的消费量(y)与居民收入(x)之间的关系 (+)
收入水平(y)与受教育程度(x)之间的关系 (+)
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系
学习成绩(y)与迟到次数(x) 之间的关系 (-)
回归分析是处理变量x与y之间统计关系的一种统计方法和技术。如果要由x预测y的值,就要利用x与y的观察值,即样本观测值(x1,y1),(x2,y2),…,(xn,yn)来建立一个公式,当给定x值后,就代入此公式中算出一个y值,这个值就称为y的预测值。
如何建立这个公式?
(1)绘制散点图
(2)建立线性函数:y= a +bx
(3)参数a,b还不知道,这就需要
由样本数据来进行估计,估计出
a,b的值后,即得到回归方程。
回归分析
1.根据研究的目的,设置指标变量
2.搜集整理统计数据
3.确定理论回归模型的数学形式
4.模型参数的估计
5.模型的检验与修改
6.回归模型的运用
建立实际问题回归模型的过程
回归模型与回归问题
对于x和y间的一元线性回归分析:
实际问题模型:
理论求解模型:
未来预测模型:
实际值
理论值
预测值
目标:
7.2一元线性回归分析
研究全国技术贸易额的变化规律并进行预测。全国每年的技术贸易额与很多因素有关,但经过分析,它主要受全国GDP这一因素的影响和制约,于是,我们来寻求二者之间的统计规律,并进行预测。
7.2一元线性回归分析
从散点图中,我们假定y与x之间大致呈线性关系,则可用直线方程
(7-1)
来近似地描述散点的分布情况。这条直线称为y对x的回归直线。其表达式(7-1)称为回归方程,a、b称为回归系数。
y=a+bx+ε
7.2.2 确定回归系数
我们的目标:
即:理论值与实际值尽量接近。
7.2.2 确定回归系数
我们的目标:
代入 并求导:
结果:
其中: 是样本均值;
7.2.2 结果及解释
最后得到我国技术贸易额与GDP的关系(亿元):
技术贸易(Technology Transactions) 是我国市场体系的重要部分,是链接科研和生产的桥梁和纽带,属于市场体系中的生产要素市场.涉及与技术开发、技术转让、技术咨询、技术服务相关的技术交易活动及相关主体。
解释:1、技术贸易只有在GDP=69.8587/0.0073
=9452.1之后才能产生;
2、每单位GDP可带动0.0073个单位的技术贸
易交易。
7.2.3 相关性检验
对回归模型描述实际数据的近似程度,也即对所得的回归模型的可信程度进行检验,称为相关性检验。
注意:1、r与Q成反比例关系;
2、以上为多元回归分析的相关系数的通用形式。
Q
当r大于某一给定的临界值时,通过相关性检验,否则不通过。
7.2.3 相关性检验
r 的取值范围是 [0,1]
|r|=1,为完全相关
r =
文档评论(0)