第3章:双变量述分析(下).ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章:双变量述分析(下)

第3章 双变量描述分析(下) 第三节: 定序变量与定序变量 第四节:定类变量与定距变量(定序-定距) 第五节:定距变量与定距变量 第六节:回归分析 一、名次解释:对子(Pairs) 对子,是指两个个案互相比较而组成的对子。 比如一个调查的样本容量为n,每个个案都与其他所有的个案两两比较共有多少个对子? 如果第一个个案的X的取值高于第二个个案,Y的取值也高于第二个个案,或者都小于第二个个案,那么这两个个案组成的对子(AB, AC)就叫做同序对(Same-Ordered Pair), 其个数记做Ns; 如果第一个个案的X的取值高于第二个个案,Y的取值却低于于第二个个案,这两个个案组成的对子(AD)便叫做异序对(Different-Ordered Pair) ,其个数记做Nd; 同分对是指X和Y的取值中至少有一个是相同的对子,我们将X相同而Y不同的对子(AE, AF)个数记做Nx,将Y相同而X不同的对子(AG,AH)个数记做Ny,将在X和Y上都相同的对子(AI)个数记做Nxy; 【练习1】 2、根据列联表的频数计算对子 同序对Ns:“右下余子式”法 n1的同序对数量为为n1(n5+n6+n8+n9); n2的同序对有n2(n6+n9)个; n4的同序对有n4(n8+n9)个 ; N5的同序对有n5*n9个 ; Ns=n1(n5+n6+n8+n9)+n2(n6+n9)+n4(n8+n9)+n5*n9个 异序对Nd:“左下余子式法” 计算异序对应该从最右上方的格子开始分析。 n3的同序对为n3(n4+n5+n7+n8)个; n2的同序对为n2(n4+n7)个 ; n6的同序对为n6(n7+n8)个 ; n5的同序对为n5*n7个 ; Nd=n3(n4+n5+n7+n8)+n2(n4+n7)+n6(n7+n8)+n5*n7 X的同分对Nx:位于同一列不同行的配对都是X的同分对,所以 Nx=n1(n4+n7)+n4*n7+n2(n5+n8)+n5*n8+n3(n6+n9)+n6*n9 Y的同分对NY:位于同一行但是不同列的配对都是Y的同分对,同理 NY=n1(n2+n3)+n2*n3+n4(n5+n6)+n5*n6+n7(n8+n9)+n8*n9 X与Y的同分对NXY:XY取值完全相同的个案两两配对的数量即是NXY, 【练习2】40名员工的工作满足感和归属感的关系如下表,请分布计算Ns,Nd,Nx,Ny,Nxy 首先,需要将变量X和Y按照同等顺序进行排列,然后才能进行计算。调整后的表格为: 二、相关系数 1.Gamma系数 适用于测量两个对称的定序变量之间的相关关系,常用G来表示,计算公式为: -1≤G≤1 Gamma 系数并不考虑各种同分对,仅仅利用同序对和异序对进行分析,如果在所有对子中以同序对为主,G为正数,表示正相关;如果以异序对为主,G为负数,表示负相关;如果两者相当或者同分对较多,则相关程度较弱。 【练习1】 【练习2】 Gamma 系数具有消减误差比例(PRE)的意义 (1)E1的含义: 设想我们不知道X和Y存在等级相关,我们把所有的对子都瞎猜一遍,就是猜测哪个对子比较高,哪个比较低。对于那些同分对,我们不考虑,因为谈不上谁高谁低。每猜一对,猜错的概率是1/2,一共猜n(n-1)/2-Tx-Ty-Txy次,则犯错误的次数是(Ns+Nd)/2=E1 (2)E2的含义: 当知道X和Y存在等级相关时,我们根据X的等级顺序来猜Y的等级顺序,猜都是同序对,也就是说,只要X高我们就猜Y高,X低我们就猜测Y低,则错误的对数就是E2=Nd 2、肯德尔等级相关系数 Kendall’s τ系数 肯德尔系数因为考虑了同分对,所以是对Gamma系数的一种修正,分为三种情况来讨论 : (1) 系数 没有同分对时,其实就是Gamma系数 有同分对时,其绝对值比Gamma系数要小。 【练习2】 (2) 系数 【练习2】 (3) 系数 其计算公式为: 【练习2】 三个Kendall’s τ系数的比较 前两个系数都具有PRE含义。 特别适合不存在任何同分对的情况; 的特殊性在于它仅适用于r=c的列联表,否则其取值的范围难以确定。 但是社会学研究中比较常见的情况是同分对很多,并且大多数列联表的行数与列数不相等,这种情况下就要采用 系数,美中不足的是这个系数没有PRE含义。 3、Somer’s d 系数 萨默斯(Somers)提出了另外一个

文档评论(0)

mk808606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档