- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章回归分析PPT
第七章 回归分析
第一节 Linear过程 线性回归
第二节 Curve Estimation过程 曲线回归
第三节 Logistic过程 罗辑斯谛回归
第四节 Probit过程 概率单位回归
第五节 Nonlinear过程 非线性回归
回归的主要内容:
从一组样本数据出发,确定这些变量间的定量关系式;
对这些关系式的可信度进行各种统计检验;
从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著;
利用求得的关系式进行预测和控制。
回归的分类:
按是否线性分:线性回归模型和非线性回归模型。
按自变量个数分:简单的一元回归,多元回归。
利用SPSS得到模型关系式,是否具有适用性,要看回归方程的显著性检验(F检验)和回归系数b的显著性检验(T检验),还要看拟合程度R2 (相关系数的平方,一元回归用R square,多元回归用Adjusted R Square)
回归分析的菜单选项及说明:
在回归过程中包括:
Liner:线性回归
Curve Estimation:曲线估计
Binary Logistic: 二分变量逻辑回归
Multinomial Logistic:多分变量逻辑回归
Ordinal 序回归
Probit:概率单位回归
Nonlinear:非线性回归
Weight Estimation:加权估计
2-Stage Least squares:二段最小平方法
Optimal Scaling 最优编码回归
1.数据正态性假设:误差项的分布与自变量无关,服
从均值0,方差常数的正态分布;
2.方差齐性假设:对不同的自变量取值条件下,误差分
布方差相同;
3.独立性假设:对不同的自变量取值条件下,误差分布
期望为0;
4.无自相关性假设:对不同的自变量取值条件下,误差
不相关;
5.随机误差与自变量对因变量的影响不相关;
4. 回归方程的建立
Enter 所有变量都进入方程(全模型)
Remove 根据设定好的条件, 删除部分变量, 通常根据变量与模型的相关性
Forward 向前选择 根据条件从无自变量开始逐个选择适合的变量进入模型
Backward 向后剔除法 根据条件从全模型中逐个剔除变量
Stepwise 逐步进入法
注:衡量变量在回归模型中作用的大小,一般用偏回归平方和刻画,令S(i1, i2, … , ik)表示方程中有变量(i1, i2, … , ik)时 残差平方和,则第 i个变量的偏回归平方和定义为:
Pi2= S(i1, i2, …im-1,im+1,… , ik)—S(i1, i2, … , ik)
Pi越大表明该变量越重要。)
5. 参入分析的观测量的选择: 利用Selection 变量的取
值实现分析中 CASE的选择
6. Statistics 选项设置:
R squared Chang : 表示当回归方程中引入或剔除
一个变量后R2的改变量。
7. 共线性诊断:回归方程中,虽然各自变量对因变量都是有意义的,但是某些自变量可能彼此相关,即存在共线性问题,因此需要对方程中的自变量进行共线性诊断。
如果存在常数C0 C1 C2,使C0= C1 X1+C2X2
则称X1,X2具有精确共线性.
如果上式近似成立, 则称近似共线性
当一组自变量有精确共线性时,必须删除引起共线性的一个或多个自变量,当共线性为近似时,要把引起共线性的自变量删除,但必须保证模型丢失信息最少。
共线性诊断常用参数:容许度()
在只有两个变量的情况下,其间的贡献性表现在两个变量间
的相关系数,相关系数为1时,精确共线性,为0时,不存
在共线性。多个变量时,Xi 与其他自变量X之间的复相关
系数的平方体现了共线性,容许度 Toli = 1—R2
当容许度较小时,自变量X与其他变量存在共线性。
容许度测量共线性的条件是:观测量应近似服从正态分布
方差膨胀因子(VIF)
方差膨胀因子 VIF=1/(1—R2) 容许度的倒数,值越大,自变量之间存在共线性可能性越大.
条件参数(Condition Index) Condition Index =
条件参数大于等于30时认为有共线性存在的可能性
共线性问题的解决方法.
剔除不重要的有共线性的变量、增加样本量、重新测量.
7.1.2实例分析
[例7.1]某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归
您可能关注的文档
最近下载
- 自行车里程速度计设计论文(本科)毕业设计论文.doc VIP
- GBT3049—2006工业用化工产品铁含量测定的通用方法1,10—菲啰啉分光光度法.pdf
- 新版《建筑设计防火规范》(GB50016-2014年)规范编制组宣讲课件.ppt VIP
- 2024年洛阳文化旅游职业学院单招职业技能测试题库及答案(全优).docx VIP
- 环保管家服务方案.docx VIP
- 2024年洛阳文化旅游职业学院单招职业技能测试题库及答案(必刷).docx VIP
- 大数据平台数据治理规划方案.docx
- 山东文旅云智能科技有限公司笔试考啥.pdf
- 航空移动卫星通信(AMSS).ppt
- 17J008 挡土墙(重力式、衡重式、悬臂.docx VIP
文档评论(0)