- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章相关分析剖析
* * 协方差为大的负值时,表示强的负线性相关关系。 * 对协方差的理解 cm kg mm kg 大于 基本结论:协方差受计量单位和数量级水平的影响,从而不能真实反映相关的程度。 * * * 相关系数(correlation coefficient):是协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。 总体相关系数 样本相关系数 常数 一致估计量 * * * Spearman等级相关系数: 用来度量定序变量间的线性相关关系。例如,不同年龄段与不同收入段等。 Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。 * 设计思想: 利用秩(数据的排序次序)。认为:如果x与y相关,则相应的秩Ui、Vi也具有同步性. 首先得到两变量中各数据的秩( Ui、Vi), 利用数据的秩( Ui、Vi )代替原始数据(xi ,yi)代入Pearson r公式中,有: * 编号 X Y 1 2 27 2 1 14 3 3 19 4 7 47 5 5 22 * 编号 X Ui Y Vi Di D2 2 1 1 14 1 0 0 1 2 2 27 4 -2 4 3 3 3 19 2 1 1 5 5 4 22 3 -1 1 4 7 5 47 5 0 0 * 当两变量为完全负线性相关时,Ui+Vi =n+1 当两变量为完全正线性相关时,Ui=Vi , 达到最小为0,r=1; 达到最大为 * 若两变量存在强正相关性,则Di2应较小,秩序相关系数较大,趋向于1; 若两变量存在强负相关性,则Di2应较大, 秩序相关系数为负,绝对值较大; 若两变量的相关性较弱,它们秩的变换不具有同步性,于是Di2应较大, r 趋向于0。 * Kendall 相关系数: 度量定序变量间的线性相关关系。 计算步骤: 首先计算一致对数目(U)和非一致对数目(V); 如: 对x和y求秩后为: x: 2 4 3 5 1 y: 3 4 1 5 2 x的秩按自然顺序排序后: x: 1 2 3 4 5 y: 2 3 1 4 5 然后计算Kendall相关系数: * 若两变量存在正强相关性,则V较小,秩序相关系数较大;若两变量存在强负相关性,则V较大,秩序相关系数为负,绝对值较大。 * 相关系数检验 一般情况下,总体相关系数是未知的,通常用r作为 的近似值。但由于r 是根据样本计算出来的,它受抽样误差的影响。由于抽取的样本不同,r 的取值也不同,能否用r说明总体的相关程度呢? 这就需要考查r 的可靠性也就是进行显著检验 (1)H0 : 两总体不存在线性相关 (2) 构造统计量 * 简单相关系数 Spearman系数,大样本 下,近似正态分布 kendall系数,大样本 下,近似正态分布 Pearson系数,服从自由度为n-2的t 分布 * (3)计算统计量的值,并得到对应的相伴概率p-。 (4)结论: 如果 ,则拒绝H0,两总体存在线性相关; 如果 ,不能拒绝H0。 * 注意: 即使统计检验表明相关系数在统计上是显著的,并不一定意味着两个变量之间就存在重要的相关性。 因为在大样本情况下,几乎总是导致相关系数显著。 比如r=0.1, 在大样本下,也可能使得r 通过检验。这就很难说明两个变量间就有实际意义上的显著关系。 * SPSS操作 (1) Analyze→Correlate→Bivariate. (2)选择参加计算相关系数的变量到[Variables]框中. (3)在[Correlation Coefficients] 框中选择计算哪种相关系数. (4)在[Test of Significance]框中选择输出相关系数检验的双尾概率P-值还是单尾概率P-值. tow-tailed:输出双尾概率P- one-tailed:输出单尾概率P- * (5)选中[Flag significance of correlations]选项表示分析结果中输出星号标记,以标明变量间的相关性是否显著。不选中则不输出星号标记。 *表示检验值发生的概率小于等于0.05,即总体无相关的可能性小于0.05; **表示检验值发生的概率小于等于0.01,即总体无相关的可能性小于0.01; **比*,拒绝原假设犯错误的可能性更小. * (6)Options按钮中的选项 statistics选项:选择输出哪些统计量。
文档评论(0)