- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一元线性回归分析
一.变量之间的关系:
函数关系:确定性关系
相关关系:不确定性关系
相关关系的测度:散点图
线性相关关系的测度:相关系数
相关关系不等于因果关系
二.回归的含义:
回归这一术语最早来源于生物遗传学,由高尔顿(Francis Galton)引入。
?回归的现代解释:回归分析是研究某一变量(因变量)与另一个或多个变量(解释变量、自变量)之间的依存关系,用解释变量的已知值或固定值来估计或预测因变量的总体平均值。
因变量:Y
自变量:X或X1,X2,…等
高尔顿的兴趣在于寻找为什么总体身高分布趋向稳定。现在我们所关心的已不是这个问题,而是想知道在已知父亲身高的情况下,儿子的身高的平均变化如何。换句话说,就是已知父亲身高来预测儿子的平均身高。
假设进行抽样试验,得以下结果:
父亲身高(X) 1.50 1.60 1.70 1.80 1.90
儿子身高(Y) 1.52 1.65 1.68 1.81 1.89
假设进行多次抽样(5次),则对于同一个X值,会有多个Y值与之对应,即Y有多个取值。假设作出的散点图如下:
为了找出X与Y的关联关系,一个自然的想法是取X=Xi时,所有Y值的平均值作为对应X=Xi时Y的代表值,亦即取:
对于任何一个X的可能值,我们都可以相应的取:
当X变化时,上式左边是X的一个确定的函数,可以记为:
于是,我们可以用一个确定的函数
来大体描述Y与X之间的变化规律。
为Y对X的回归方程,它反映了X固定的条件下Y的平均状态的变化情况。Y对X的回归就是Y对X的条件期望函数。
三.相关分析和回归分析之间的关系
相关分析的主要目的在于度量两个变量之间的线性关系的程度。
回归分析,已如前述,我们首先并不对这种度量有兴趣,而主要是想根据一些有关变量的已知值来估计或预测某一变量的平均值。
相关分析与回归分析在技术上的区别:
相关分析同等对待任何两个变量,无自变量和因变量的区别。两个变量都假定为随机变量。
回归分析对自变量和因变量不同对待。因变量是随机变量,而自变量是非随机的,是给定(固定)变量。
四.总体回归函数
定义:每一个条件均值E(Y/X=Xi)(简写为E(Y/Xi)是Xi的一个函数,即:
:总体回归函数
设
(线性总体回归函数)
:截距(intercept)
:斜率系数(slope)
五.线性的意义:
变量线性:变量的幂指数为1,没有两个不同变量的乘除运算,也没有自变量作为幂指数运用。
参数线性:参数的幂指数为1。
线性回归一般指的是参数的线性,而变量可能是线性,也可能是非线性。
六.总体回归函数的整体设定:
设各个 与其期望值的离差为:
即:
:随机误差项,不可观察的随机变量,可以为正,也可为负。
当 时,则:
随机误差项的性质:
可能代表了模型中并未包括的变量的影响;
反映了人类行为中的一些内在随机性;
可能反映一些测量误差。
七.样本回归函数:
当未掌握总体资料时,以样本资料拟合的回归线是总体回归线的近似代表(估计),因此样本回归函数可以写为:
(假设为一元线性回归模型)
样本回归函数也可以有随机设定的方程,设
即:
:残差项,简称残差,是 的估计。
八.回归模型的假定:
回归模型的基本假定:
1.线性假定:自变量与因变量是线性函数关系。
即:
2.解释变量X与扰动项u不相关假定:
当X是非随机变量,即确定性变量时,该条件自动满足;
当X是随机变量时,该假定要求X与u不相关。
3.关于随机误差项(扰动项)的假定:
a.零均值假定:给定解释变量的值,随机误差项的期望值为0。即:
结合上一假定,该条件等价于:
b.同方差(homoscedasticity)假定:
不同的扰动项具有相同的方差。即:
否则称为异方差。结合前面的假定,同方差假定等价于:
c.无自相关或序列相关(no autocorrelation)假定:不同扰动项之间的协方差为零,即:
该假定等价于:
4.模型设定的假定:回归模型的设定是正确的,即模型不存在设定偏差(Specification bias)或设定误差(specification error)。
5.扰动项的假定:扰动项服从正态分布。
结合3和4即为:
九.参数的估计:最小二乘估计
最小二乘法则:所谓最小二乘法则,就是按照使残差平方和最小的原则来确定回归系数的估计量,从而建立拟合最佳的样本回归方程。
依据最小二乘法则确定参数,从而建立样本回归函数的方法,叫最小二乘法。
要使Q最小,即求函数的极值。
为此,要
您可能关注的文档
最近下载
- 北京市西城区2025-2026学年高一上学期期末考试 物理含答案 .pdf VIP
- 微生物发酵机制.pptx VIP
- 施工场地已具备施工条件的证明.doc VIP
- 2025年福州城市建设投资集团公司治理结构组织架构和部门职能.docx
- GM_T 0027-2014 清晰版 智能密码钥匙技术规范.docx VIP
- 2025年轮机英语问答题答案全 .pdf VIP
- 微生物代谢产物发酵.pptx VIP
- 新教材-普通高中教科书物理教师用书选择性必修1 电子版.pdf VIP
- 砖厂突发环境事件应急预案.pdf VIP
- 高中政治部编版必修四《哲学与文化》全册知识点填空练习(分单元课时编排)(附参考答案)(2023秋最新版).pdf VIP
文档评论(0)