- 1、本文档共110页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2012年下-第8章-SPSS的相关分析和线性回归分析
回归方程的 拟合优度检 验(判定系数) 向后筛选策略-结果 DW值在1.5-2.5之间,可以说明没有自相关现象 回归方程 的显著性 检验 向后筛选 策略-结果 向后筛选 策略-结果 回归参数 的估计+ 回归系数 的显著性 检验 向后筛选 策略-结果 每步排除 的变量 向后筛选 策略-结果 残差累计 概率图 从图中可知残差近似服从标准正态分布 向后筛选 策略-结果 残差图 从图中可知,数据点无明显规律,残差序列是独立,且都在±3个标准差范围内,无异常点 向后筛选 策略-结果 标准化残差和标准化预测值的 Spearman等级相关分析-操作 标准化残差和标准化预测值的 Spearman等级相关分析结果 计算残差与预测值的相关性弱, 认为异方差现象不明显 标准化残差的非参数检验-操作 标准化残差的非参数检验结果 可认为标准化残差服从标准正态分布 练习 1、为研究收入和支出的关系,收集1978-2002年我国的年人均可支配收入和年人均消费性支出数据,研究收入与支出之间是否具有较强的线性关系。 2、以年人均支出和教育数据为例,建立回归方程研究年人均消费支出、恩格尔系数、在外就餐、教育支出、住房人均使用面积受年人均可支配收入的影响。 相关回归分析(年人均消费支出和教育).sav 1、分析?回归?权重估计。 加权回归的举例 mallcost.sav 输出结果 1、分析?回归?两阶最小二乘法。 两阶最小二乘法 (自学) cross_sell.sav 两阶最小二乘法的SPSS实现,可进一步阅读参考书,杜强、贾丽艳,《SPSS统计分析从入门到精通》,人民邮电出版社,2011年 该书中的第8.9章节,两阶最小二乘回归. Thank you * * * * * * * * 满足Gauss-Markov条件(即等方差与不相关假定): 正态分布假定条件: 各自变量序列之间不相关: 线性回归模型的假设条件 多重共线性 自相关 异方差 残差是指由回归方程计算得到的预测值与实际样本值之间的差距,定义为: 对于线性回归分析来讲,如果方程能够较好的反映被解释变量的特征和规律性,那么残差序列中应不包含明显的规律性。残差分析包括以下内容:残差服从正态分布,其平均值等于0;残差取值与X的取值无关;残差不存在自相关;残差方差相等。 4. 残差分析 1) 对于残差均值和方差齐性检验可以利用残差图进行分析。如果残差均值为零,残差图的点应该在纵坐标为0的中心的带状区域中随机散落。如果残差的方差随着解释变量值(或被解释变量值)的增加呈有规律的变化趋势,则出现了异方差现象。 异方差的检验与处理 2) Spearman(斯皮尔曼)检验,即等级相关系数检验 建模时不能消除数据的异方差,只能消除异方差带来的不良影响。最常用的方法是加权最小二乘法(Weighted Least Squares, WLS)。 DW检验用来检验残差的自相关。检验统计量为: DW=2表示无自相关,在0-2之间说明存在正自相关,在2-4之间说明存在负的自相关。一般情况下,DW值在1.5-2.5之间即可说明无自相关现象。 自相关的检验 SPSS 操作模块 回归分析问题 线性回归 解决一元线性回归和多元线性回归的基本问题 加权回归 解决异方差问题,可给自变量加上不同的权重 二阶最小二乘法 解决预测变量与误差项相关的问题(自相关) 异方差和自相关的处理方法 5. 多重共线性分析 多重共线性是指解释变量之间存在线性相关关系的现象。测度多重共线性一般有以下方式: 1) 容忍度: 其中, 是第i个解释变量与方程中其他解释变量间的复相关系数的平方,表示解释变量之间的线性相关程度。容忍度的取值范围在0-1之间,越接近0表示多重共线性越强,越接近1表示多重共线性越弱。 2) 方差膨胀因子VIF。方差膨胀因子是容忍度的倒数。VIF越大多重共线性越强,当VIF大于等于10时,说明存在严重的多重共线性。 3) 特征根和方差比。根据解释变量的相关系数矩阵求得的特征根中,如果最大的特征根远远大于其他特征根,则说明这些解释变量间具有相当多的重复信息。如果某个特征根既能够刻画某解释变量方差的较大部分比例(0.7以上),又能刻画另一解释变量方差的较大部分比例,则表明这两个解释变量间存在较强的线性相关关系。 4) 条件指数。指最大特征根与第i个特征根比的平方根。通常,当条件指数在0-10之间时说明多重共线性较弱;当条件指数在10-100之间说明多重共线性较强;当条件指数大于100时说明存在严重的多重共线性。 从有共线性问题的变量中删除不重要的变量; 增加样本量或重新抽取样本; 采用其它方法拟合模型:如逐步回归、岭估计、主成分分析法等。 多重共线性
您可能关注的文档
- 2011年水沐天城国际社区盛大开盘仪式策划方案.ppt
- 2011年福建本一校院校投档线.doc
- 2011年现用政治复习经济生活6课-投资理财的选择.ppt
- 2011年福建高考文综地理卷.doc
- 2011年皖投置业客户回馈活动策划案.ppt
- 2011年深圳航空大运空姐招募大赛策划案.ppt
- 2011年竹林七贤别墅项目营销策略方案.ppt
- 2011年造价员考试(一).doc
- 2011年浦江音乐盛典赞助策划案.ppt
- 2011年樱花之恋-湖南万人相亲大会策划.ppt
- 艺术区块链技术应用案例,2025年版权确权效果评估报告.docx
- 个性化潮玩产品设计与社群用户粘性研究.docx
- 数字藏品市场发展现状与前景分析报告.docx
- 剧本杀行业2025年女性市场细分盈利策略分析.docx
- 数字藏品市场政策分析:2025年行业创新与监管挑战.docx
- 数字藏品交易平台与数字艺术市场融合创新研究报告.docx
- 2025年低空经济政策白皮书:政策解读与产业发展.docx
- 2025年半导体材料国产化率提升中的技术创新与市场应用报告.docx
- 2025年塑料生产者责任延伸法规对塑料行业绿色物流体系的影响.docx
- 2025年青少年编程教育课程体系标准化国际交流与合作报告.docx
文档评论(0)