- 1、本文档共73页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相关分析和线性回归分析;一、相关分析和回归分析概述;事物之间的函数关系比较容易分析和测度,而统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强,有的关系弱,程度各异。相关分析和回归分析正是以不同的方式测度事物间统计关系的非常有效的工具。;二、相关分析;;(二)散点图;散点图的基本操作;练习;相关系数;相关系数r;对样本来自的两个总体是否存在显著的线性关系进行推断;基本步骤;Pearson 简单相关系数;Spearman 等级相关系数;Kendall ’s系数;前提:
正态分布:皮尔逊积矩相关只适用于双元正态分别的变量。如果正态分布的前提不满足,两变量之间的关系可能属于非线性相关。
样本独立性:被试必须来自于总体的随机样本,且被试之间必须相互独立。
替换极值:变量中的极端如极值、离群值对相关系数的影响较大,最好加以剔除或代之以均值或中数。;练习;三、偏相关分析;偏相关也称净相关,它在控制其他变量的线性影响的条件下分析两变量间的线性相关,所采用的工具是偏相关系数。
控制变量数为1时,偏相关系数称为一阶偏相关;当控制两个变量时,称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是相关系数。;如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。
偏相关分析即衡量两变量之间的关系,使与这两变量有关的其他变量都保持不变。这样可以判断哪些自变量对因变量的影响较大。
中介变量假设模型:两个变量相关显著的原因在于变量A通过中介变量影响了变量B。在排除了中介变量的效应后,两个变量的相关系数应为0。;步骤;练习;线性回归分析;回归分析与相关分析的关系;一些概念;获得回归线通常采用的两种方法;回归分析的一般步骤;确定回归模型;建立回归方程;对回归方程进行各种检验;利用回归方程进行预测;步骤;线性回归模型;一元线性回归模型;多元线性回归模型;多元线性回归的条件;多元回归方程中的自变量选择;2、后退法(Backward),将已纳入方程的变量按对因变量的贡献大小由小到大依次剔???,每剔除一个自变量,即重新检验每一自变量对因变量的贡献。
3、前进法(Forward),对已纳入方程的变量不考察其显著性,直到方程外变量均达不到入选标准。
4、强制剔除法(Remove)与后退法相同,只是筛选的是Block;5、逐步回归法( Stepwise ),运用很广,报告中出现的几率最高。结合了前进法和后退法的优点。第一,模型中先不包含任何预测变量,与因变量相关最高者首先进入回归方程;第二,控制回归方程中的变量后,根据每个预测变量与因变量的偏相关的高低来决定进入方程的顺序;第三,已进入方程的自变量,每引入一个自变量,就对方程中的每一自变量进行显著性检验,若发现不显著,就剔除;每剔除一个自变量有也对留在方程中的自变量再进行显著性检验,再不显著,又剔除,直至没有自变量引入,也没有自变量剔除为止。;在选择回归的方法时,注意专业上的要求要先于统计学检验的准则。
Hower(1987)建议:(1)应优先使用enter或stepwise。(2)使用enter时,可根据研究计划时的相关理论,决定变量投入的顺序。;回归方程的统计检验;回归方程的拟合优度检验;拟合优度检验采用R2统计量,该统计量称为判定系数或决定系数,它是SSA/SST
反映因变量的全部变异中能够通过回归关系被自变量解释的比例,即检验回归的效果如何。
如果自变量的个数很多,有时要以调整后的决定系数代替原先的决定系数。因为增加新的自变量会使决定系数增大,这种决定系数会有高人为控制的机制在内,此时用调整后的决定系数更好。;回归方程的显著性检验;回归系数的显著性检验;t统计量:在一元线性回归分析中,回归方程显著性检验和回归系数显著性检验的作用是相同的,两者可以相互代替,同时回归方程显著性检验中F=t2。
但在多元线性回归中的这两种检验通常不能互相替代。;残差分析;如何看回归结果?;回归分析的三个重要指标;练习;虚拟变量;如性别变量有男或女两类,可将两个类别分别以两个0/1二值变量的形式重新编码。设置变量X1表示是否男,取1表示男,取0表示不是男。再设置变量X2表示是否女,取1表示是女,取0表示不是女。
产生的回归方程中各虚拟变量回归系数的含义是,相对参照类,各个类对解释变量平均贡献的差,进而可进一步研究各类别间对被解释变量的平均贡献差异。;Collinearity diagnostics (共线性诊断);自变量间是否有共线性问题,可以由以下数据判断:;(3)条件指针(condition index,CI),CI 越大,越有共线性问题。Eigenvalue condition index(k)若k2=100表示存在复共线,
文档评论(0)