- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归分析及进阶分析-多元回归与结构方程模型
多元回归与结构方程模型;回归分析
一元回归
多元回归;回归分析是研究一个变量(被解释变量/因变量)对另一个或多个变量(解释变量/自变量)的依赖关系。变量之间的关系可分为线性关系和非线性关系。
在进行回归分析之前,要先分析变量之间是否存在线性相关关系,如果变量间不存在线性相关关系,则使用基于最小二乘法的回归分析所得的的结果是不可靠的。
多元回归—2个以上的自变量;研究一个变量(被解释变量/因变量)对另一个或多个变量(解释变量/自变量)的依赖关系。变量之间的关系可分为线性关系和非线性关系。
;;自变量x与因变量y皆为定量(定距变量、定比变量),而非定性(定类变量、定序变量)
如果要将定类、定序变量放入回归,须转化为虚拟变量(dummy variable)。如未转换,则有可能造成就对结果解释的偏误。
;;年龄是否影响智商(IQ)
定量---定??
年龄是否影响对电脑品牌的选择
定量---定性
性别是否影响对电脑品牌的选择
定性---定性
。。。。。。
;考虑家庭月可支配收入如何影响消费支出。
可支配收入 X(千元)
消费支出 Y(千元);假设样本为10,;
为了拟合这样一条直线,需要某种准则。准则不同,拟合的方法也就不同,拟合出来的直线就不一样。最常用的准则是普通最小二乘准则。;;残差e——根据样本所拟合出来的直线上的y值与样本实际观测到的y之间的距离。这个值可以观测到。
误差E/Ksi——总体直线中,x与常数项不能解释的总体y的部分。不可观测。它来自随机性与测量误差。;用样本回归直线与推断总体回归直线
用一些指标来判断推断的是否合理(接近)
;样本回归方程
求出参数
需要一个公式/准则:
所有观测点与直线的垂直距离 (称为残差 Residual)都尽可能地小,即让所有的观测点与直线的垂直距离之和∑e为最小。
有些观测点在直线之下,因此有些e是正的,有些是负的。相加后正负抵销,有可能总和∑e很小但是个别是的e还是很大。为了克服这个问题,我们先将e平方使它们都变成正的,然后再求和并使之变成最小,这就是所谓的“普通最小二乘法(OLS——Ordinary Least Squares)准则”
;目标函数:min
变量:b0和b1
;要想使 b0和 b1更稳定,在收集数据时,就应该考虑 X 的取值尽可能分散一些;样本容量也应尽可能大一些,样本量太小时,估计量的稳定性肯定不会很好。;拟合优度:
样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。
判定系数
回归方程的显著性检验:
F检验
对因变量与所有自变量之间的线性关系是否显著的一种假设检验
回归系数的显著性检验
根据样本估计的结果对总体回归系数的有关假设进行检验
T检验
;;
平方,对所有的点求和,最终可得
总离差平方和(Total Sum of Squares)
残差平方和(Residual Sum of Squares)
回归平方和(Explained Sum of Squares)
;
;如果比例值 ESS/RSS 较大,说明 X 对 Y 的解释程度高,可以认为总体存在线性关系,反之总体可能不存在线性关系。做利用这个值 ESS/RSS 进行推断。由于对不同的样本,这个比值可能不同,因此对给定的样本,利用这个比值进行推断,必须在统计假设检验的基础上进行
可以证明,在一元线性回归条件下,ESS和 RSS分别服从自由度为 1和 n-2 的 卡方 分布
; H0:B2=B3=0
等同于零假设H0:R2=0
这个假设表明两个解释变量一起对应变量Y无影响,这是对估计的总体回归直线的显著性检验。
Note:书上的写反了。
如果分子比分母大,也即Y被回归解释的部分比未被回归解释的部分大,F值越大,说明解释变量对应变量Y的变动的解释的比例逐渐增大,就越有理由拒绝零假设。
期望:拒绝零假设,即,F检验要显著
;当样本为小样本时,回归参数估计值的标准化变换变量并不遵循正态分布规律,而是服从自由度为 n-2 的t分布;H0:B2=0。
X对Y的影响为0
期望:拒绝零假设,要显著
如果 t 的绝对值大于临界值(或者 pα) ,就拒绝原假设,接受备择假设,说明 X 对 Y具有显著的影响作用;反之,如果 t 的绝对值小于临界值的绝对值(或者 pα) , 则接受原假设,说明 X 对Y 没有显著的影响
;;;;每次回归的F值及其显著性
每个自变量的系数,及其T检验的显著性
判定系数
判定系数的变化及其显著性;;;;回归分析结果;;;;补充专题;曲线关系检验;步骤;U形、倒U形;;中介:
Baron3步检验:
;调节:
整体模型的F检验
交互项的系数的T检验
R Square ch
您可能关注的文档
最近下载
- 《市政排水管道气囊封堵施工规程》.pdf
- TOPRAAD920印刷模切开槽机.pdf VIP
- 单相整流电路建模与仿真.doc VIP
- 缺血性脑血管病临床管理指南解读.pptx VIP
- 工程概算预算审核方案(3篇).docx VIP
- 神经重症气管切开患者气道功能康复与管理专家共识2024.pptx VIP
- 2025年监理工程师之监理概论考试题库及答案(名师系列).docx VIP
- 2025年监理工程师之监理概论押题练习试卷B卷附答案 .pdf VIP
- 2025年监理工程师之监理概论考试题库及完整答案(必刷).docx VIP
- 2025年监理工程师之监理概论押题练习试卷A卷附答案 .pdf VIP
文档评论(0)