- 1、本文档共71页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教材;参考书;回归分析的一般介绍;一、变量间的统计关系; 在实际问题中,变量间存在大量非确定关系,它们之间虽存在密切,但其密切程度不是由确定关系能够刻画的。
例如:人的血压与年龄之间也存在着关系。
但相同年龄的人血压往往不相同。
子女的身高和父母的身高有很强的关系。
一般来说,父母身高越高,孩子身高也高,
但是父母身高相同,子女的身高可以不相同。; 在这种非确定性关系中,自变量(如:年龄、父母的身高)取确定值时,因变量的值(如:血压、子女的身高)是不确定的,
但两者有一定联系。这种不完全确定的变量间的关系称为统计相关关系。
更确切地说,若一个变量X取某一个可能值时,对应地随机变量Y有一个确定的且与有关的分布(或条件分布)存在,则称Y与X有统计相关关系(这里X和Y也可以是向量)。;二、回归模型??一般形式;线性回归模型:
回归常数: ;
回归系数: 。
;设样本观察值为 ,则线性回归模型可表示为
参数估计:
经验回归方程: ;
Y的预测值:
;三、回归模型的基本假设; 回归分析目前是所有统计分支中应用最广泛的一门学科,它被用于几乎所有的研究领域及工农业生产,包括产品的统计质量管理,市场预测,自动控制中数学模型的建立、气象预报、地质勘探、医学卫生等等。回归分析研究的范围大致如下:
;; 在回归分析中,当自变量给定x的值时,y的值不能确定,只能通过一定的概率分布来描述。
用F(y|x)表示当X=x时,所对应的Y的分布函数。若Y的数学期望E(Y|x)存在,则它的值随x取值而定,是x的函数,记为 f(x).称f(x)=E(y|x)为y关于x的均值回归函数。; 回归分析的方法以至“回归”这个名称的起源,统计史上一般归功于英国生物学家兼统计学家F.Galton(1822—1911)。
Galton是一个英国绅士科学家之一。他是一个上层英格兰人,在剑桥学医。他在开始遗传学研究之前,他探索了非洲大陆。在1859年出版的巨著《物种的起源》的Ohnrles Dorwin是他的侄子。;;六、建立实际回归模型的过程;1.在回归分析的应用中,定性分析和定量分析相结合。 回归方程在一定程度上揭示了两个相关变量x和y之间的规律。 但仔细研究回归直线计算公式时就会发现,在计算过程中,并不需要事先假定两个变量之间一定要具有线性相关关系。这就是说,就方法本身而言,即使是对平面上一堆杂乱无章的点,也可以用最小二乘法给它们配一条直线来近似表示x和y之间的关系。如果x和y之间根本不存在线性相关关系,这样求出的回归方程其实是没有意义的。通常情况下,希望因变量与自变量有因果关系。
2.自变量选择原则:少而精。
自变量太多,会出现共线性和随机误差增大,影响计算精度;
漏掉主要变量肯定会影响模型效果。;3.数据收集:时间序列数据、横截面数据、面板数据。如何掉调整统一统计口径,如何折算、差分、取对数、标准化、补缺、处理异常值、处理异方差数据。
4.模型的检验:放在实践中去检验;统计检验包含模型检验与回归系数的检验。
5.回归模型的应用:下结论。
好的模型可用来进行分析、控制和预测。;6.回归分析,随着自变量的增加,计算会变得相当复杂,所以在计算机出现以前,它的应用受到了一定的限制。随着计算机的不断发展,速度成倍增加,回归分析的复杂的计算问题已经基本解决。目前世界上有许多能进行回归分析的统计软件:如SAS、SPSS、S-PLUS、R等等。;有关理论
模型
数据
统计技术
有关假定;思考题;第一章;§1.1一元线性回归模型;例1.1 Forbes 数据
为了研究水的沸点和气压之间的关系,测得17个地方的数据如下表:
;编号; |
|
| A
144 +
|
|
|
|
| A
142 +
|
|
|
|
|
140 +
文档评论(0)