- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[相关和回归
程建华 jhcheng0724@163.com Tel* 相关分析与回归分析 相关分析 线性回归模型简介 关于线性回归的高级话题 相关分析 常用术语 直线相关 两变量呈线性共同增大 呈线性一增一减 曲线相关 两变量存在相关趋势 并非线性,而是呈各种可能的曲线趋势 正相关与负相关 完全相关 相关分析 分析过程介绍 Bivariate过程 进行两个/多个变量间的参数/非参数相关分析 如果是多个变量,则给出两两相关的分析结果 Partial过程 对其他变量进行控制 输出控制其他变量影响后的相关系数 这种分析思想和协方差分析非常类似 相关分析 分析过程介绍 Distances过程 对同一变量内部各观察单位间的数值或各个不同变量间进行相似性或不相似性(距离)分析 前者可用于检测观测值的接近程度 后者则常用于考察各变量的内在联系和结构。 一般不单独使用,而是作为预分析过程 相关分析 Bivariate过程 销售额与与竞争对手距离(步行所需时间)间的关系。Corr.sav 散点图 非参数相关系数 步骤: 1、在SPSS中打开数据,并进行数据整理(可略) 2、散点图:判断是否有相关趋势,该趋势是否呈线性 3、进行相关分析 4、考察相关系数和检验结果 相关分析 Partial过程 现已测得20名糖尿病人的血糖、胰岛素及生长激素的测量数据,请分析糖尿病人血糖浓度与生长激素浓度间有无相关关系。pcorr.sav 常识:血糖浓度和胰岛素间存在着密切的关系。 练习 Life.xls是某市从1978年至1992年的一份统计表,内容包括商品零售总额、居民收入和全市人口数,试分析它们之间是否存在线性关系,强度如何。 数据Employee data.sav,试分析工资的高低是否和教育水平相关。 线性回归模型简介 线性回归模型简介 概述 线性回归 非线性回归 针对因变量为分类资料的回归方法 其它回归过程 线性回归模型简介 概述 线性回归 非线性回归 针对因变量为分类资料的回归方法 其它回归过程 线性回归模型简介 模型适用条件 线性趋势 独立性 正态性 方差齐性 如果只是探讨自变量与因变量间的关系,则后两个条件可以适当放宽 样本量 根据经验,记录数应当在希望分析的自变量数的20倍以上为宜。 线性回归模型简介 常用指标 偏回归系数 相应的自变量上升一个单位时,因变量取值的变动情况,即自变量对因变量的影响程度。 标化偏回归系数:①解决量纲问题;②减少在拟合回归模型计算时的截断误差(Roundoff Errors),提高精度 决定系数 相应的相关系数的平方,用R2表示,它反映因变量y的全部变异中能够通过回归关系被自变量解释的比例。 修正的决定系数 线性回归模型简介 分析步骤 做出散点图,观察变量间的趋势 线性回归模型简介 分析步骤 考察数据的分布,进行必要的预处理。即分析变量的正态性、方差齐等问题 进行直线回归分析 残差分析 残差间是否独立(Durbin-Watson检验) 残差分布是否为正态(图形或统计量) 线性回归模型简介 残差分析 自变量与因变量之间存在的线性关系 种观察间相互独立,即任两个观察残差的协方差为0 残差ei服从正态分布N(0,σ2) 方差齐性,即ei的大小不随所有变量的取值水平的改变而改变。 线性回归模型简介 分析步骤 残差分析 线性回归模型简介 分析步骤 强影响点的诊断 多重共线性问题的判断 这两个步骤和残差分析往往混在一起,难以完全分出先后 分析实例 建立销售额与距离间的回归方程。Corr.sav 使用方差分析模型拟合 残差分析 对残差的图形化分析 绘制个体参考值范围以及均值数的可信区间 多重共线性问题的判断 房屋售价影响因素的分析。Homes.sav 关于线性回归模型的高级话题 强影响点的诊断 诊断 多重共线性问题的判断 做出散点图,观察有无离群值 使用Statistic子对话框中的残差诊断指标 使用残差图 关于线性回归模型的高级话题 强影响点的诊断与对策 距离指标 Mahalanobis:多个自变量出现大的马氏距离 Cook’s:大于1 Leveage Values:杠杆值,大于2*p/n 专门的影响力统计量:这几个值越大说明强影响点存在性大。 DfBeta(s):去除观察值后回归系数的变化值 Standardized DfBeta:标准化DfBeta值,大于2/Sqrt(p/n) DfFit:表示去除该观察值后预测值的变化值 Standardized DfBeta:标准化DfFit值,大于2/Sqrt(p/n) Covariance ratio:协方差阵比率,大于3*p/n 关于线性回归模型的高级话题 强影响点的诊断与对策 去除 补充进行个案分析 变量变换 非参数估计 (Nonparam
您可能关注的文档
- [本小利大的生意,本小利大的网上生意,投资小回报快的生意.ppt
- [本田i-VTEC发动机技术.ppt
- [目标管理操作务实.ppt
- [目标行动计划的制定.ppt
- [目标设定与客户分类.ppt
- [目标绩效上.ppt
- [本的贸易关系.ppt
- [目标设置提升业绩.ppt
- [本硕交流会考研讲座符美燕20XX320XX.ppt
- [本田crv专用飞歌三代导航功能介绍.ppt
- 2025年物流行业智能化转型:京东物流供应链效率分析报告.docx
- 共享自习室空间布局与使用者舒适度分析报告.docx
- 2025年露营热潮下户外用品行业竞争格局研究报告.docx
- 2025年社区团购用户购买力分析及策略研究.docx
- 《多元智能理论在小学语文教学中的跨学科融合与实践》教学研究课题报告.docx
- 2025年跨境电商物流供应链风险管理研究.docx
- 2025年数据要素市场交易规则对数据共享平台的影响分析.docx
- 2025年美妆护肤电商供应链智能化升级与效率提升报告.docx
- 《共享出行模式下的城市交通拥堵缓解与运营优化策略探讨》教学研究课题报告.docx
- 企业对教育质量控制的认知差异.docx
文档评论(0)