线性回归分析思路总结.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
线性回归分析是一种研究影响关系的方法,在实际研究里非常常见。不管你有没有系 统学习过,对于线性回归,相信多少都有那么一点了解。 即使如此,在实际分析时,还是会碰到很多小细节,让我们苦思冥想,困扰很久,以 致拖慢进度,影响效率。 因此本文就一起梳理下回归分析的分析流程,闲话少说,我们开始吧。 回归分析实质上就是研究一个或多个自变量X对一个因变量Y (定量数据)的影响关系 情况。 当自变量为1个时,是一元线性回归,又称作简单线性回归;自变量为2个及以上时, 称为多元线性回归。在SPSSAU里均是使用【通用方法】里的【线性回归】实现分析的。 □通用方法 SPSSAU -线性回归 数据类型 线性回归要求因变量Y (被解释变量)一定是定量数据。如果因变量Y为定类数据,可 以用【进阶方法】中的【logit回归】。 有序Lciq t I偏相关双因素方差 有序Lciq t I 偏相关 双因素方差 变量筛选 对于引入模型的自变量,通常没有个数要求。但从经验上看,不要一次性放入太多自 变量。如果同时自变量太多,容易引起共线性问题。建议根据专业知识进行选择,同 时样本量不能过少,通常要满足样本个数是自变量的20倍以上。 如果自变量为定类数据,需要对变量进行哑变量处理,可以在SPSSAU的【数据处理】 一【生成变量】进行设置。具体设置步骤查看SPSSAU有关哑变量的文章:什么是虚拟 变量?怎么设置才正确? 控制变量,可以是定量数据,也可以是定类数据。一般来说更多是定类数据,如:性 别,年龄,工作年限等人口统计学变量。通常情况下,不需要处理,可以直接和自变 量一起放入X分析框分析即可。 正态性检验 理论上,回归分析的因变量要求需服从正态分布,SPSSAU提供多种检验正态性的方法。 S可视化 V 可视化-直方图 口通用方法 v 0可视化 V 敏点图] 直方图 描述 危 取斥方) 谴线图 词云 「葬美 统性回归 误差巍图 T蜂 R*曲线 象眼圈 配町哈验 帕期托图 箴状图 非?散聘蛤 通用方法-正态性检验 可视化-P-P/Q-Q图 如果出现数据不正态,可以进行对数处理。若数据为问卷数据,建议可跳过正态性检 验这一步。原因在于问卷数据属于等级数据,很难保证正态性,且数据本身变化幅度 就不大,即使对数处理效果也不明显。 散点图和相关分析 一般来说,回归分析之前需要做相关分析,原因在于相关分析可以先了解是否有关系, 回归分析是研究有没有影响关系,有相关关系但并不一定有回归影响关系。当然回归 分析之前也可以使用散点图查看数据关系。 SPSSAU 操作 案例:在线英语学习购买因素研究 ①操作步骤 将性别、年龄、月收入水平、产品、促销、渠道、价格、个性化服务、隐私保护共九 个变量作为自变量,而将购买意愿作为因变量进行线性回归分析。 勾选“保存残差和预测值”。 ②指标说明 线性回归弁析结果 非桁港化.系融 B 标淮匣 帙准化Jfi牧 跚槌 * VIF R1 调酬 F 常蜘 1.239 0.179 6.91 a 0.367 29并二卷.驰LP二。炳小 产品 0.176 0.214 3.542 0.00。 1.729 Q.115 Q.1知 通9 。.四甲、 1,254 0.043 □.113 1M1 0.054 11 情榕 0.028 0.044 0.637 0.525 1.4B3- 个性化.用苛 0.1S6 0222 3.712 o.cflo ■- L84 o.oai 。物 D.TI4 2C691 0.039 L44Q 因登■:购买意愿 * pcD.05 ■ * pcO.Ol 非标准化系数(B):非标准化回归系数。回归模型方程中使用的是非标准化系数。 标准化系数(Beta):标准化回归系数。一般可用于比较自变量对Y的影响程度。 Beta值越大说明该变量对Y的影响越大 t值:t检验的过程值,回归分析中涉及两种检验(t检验和F检验),t检验分别 检验每一个X对Y的影响关系,通过t检验说明这个X对Y有显著的影响关系;F检验 用于检验模型整体的影响关系,通过F检验,则说明模型中至少有一个X对Y有显著 的影响关系。此处的t值,为t检验的过程值,用于计算P值。一般无需关注。 p值:t检验所得p值。P值小于0.05即说明,其所对应的X对因变量存在显著性 影响关系。 VIF值:共线性指标。大于5说明存在共线性问题。 R :决定系数,模型拟合指标。反应丫的波动有多少比例能被X的波动描述。 调整R :调整后的决定系数,也是模型拟合指标。当x个数较多是调整既匕R更 为准确。 F检验:通过F检验,说明模型中至少有一个X对Y有显著的影响关系。分析时主 要关注后面的?值即可。 D-W值:D-W检验值,Durbin-Watson检验,是自相关性的一项检验方法。如果D-W 值在2附近(1.7~

文档评论(0)

dajiede + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档