列联表模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
有些数据是类型变量,要求做因素影响的显著性分析或相关分析可以采用本模型 本模型的相关分析涉及三种相关系数,而且是层层递进的,我们可以刻意将它们写成模型的一步步改进 列联分析模型 列联表 列联表是由两个及两个以上的变量进行交叉分类的频数分布表。我们以是否就业和政治面貌为例,可以有以下列联表(24): 表1.2.1 群众 团员 党员 其他 总和 就业 没就业 总和 n 其中,n是总体样本数。交叉项为频数。 列联表中统计量 统计量常用于列联表中变量之间是否相关的检验。用表示观察值频数,用表示期望值频数,则统计量可以写为: (公式1.2.2) 的自由度计算: 自由度=(行数-1)(列数-1)=(R-1)(C-1) 如表1.2.1(24)列联表的分布的自由度为(2-1)(4-1)=3 φ相关系数测定与影响就业因素间的相关性 φ相关系数是描述22列联表数据相关程度较好的一种相关系数。计算公式为: (公式1.2.3.1) 式中,是按(公式1.2.2)计算出的值;n为列联表中的总频数,及总体样本数。 由表1.1知,有五个影响因素是二分变量,我们可以采用φ相关系数分析的方法。其列联表如下: 表1.2.3 是否就业与因素X的22列联表 因素X 总计 x1 x2 就业(1) a b a+b 没就业(2) c d c+d 总计 a+c b+d 表1.2.3中,a,b,c,d均为条件频数。在22列联表中,每个单元中频数的期望值为: 由(公式1.2.2)有: 将此结果代入(公式1.2.3.1),得到: (公式1.2.3.1) 分析: 由上式我们知道,当ab-bc时,φ=0,两者完全独立。若b=0,c=0, φ=1;若a=0,d=0, φ=-1。由于列联表中,变量的位置可以任意变换,因此φ的符号在这里没实际意义,其绝对值=1只是表面两者完全相关。在此模型中,φ的取值范围是在0~1之间,且φ的绝对值越大,说明是否就业与因素X的相关程度越高。对于表1.1中的五个二分变量的因素的研究,我们可以采用22列联表的φ相关系数。但是对于其他的不是二分变量的因素,其在列联表RC中的列数C大于2时,φ系数将随C的增大而增大,且φ没上限。这时用φ系数测定两者的相关程度就不够清晰,所以,对其他的因素与是否就业之间的相关性的测定,我们采用列联相关系数。 列联相关系数(C系数)测定与影响就业因素间的相关性 列联相关系数用于大于22列联表的情况。C系数的计算公式为: (公式1.2.4) 分析: C系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。因此,根据不同的行和列计算的列联系数不能比较。所以,我们对方案进行改进,采用V相关系数测定与影响就业因素间的相关性,并进行排序。 V系数测定与影响就业因素间的相关性 V系数是鉴于φ系数无上限、C系数小于1的情况。计算公式为: (公式1.2.5) 式中表示取行数和列数中较小的一个。由于此模型中,行数均为2,所以,得到的V相关系数不随列数的增大而变化,我们可以用V相关系数来比较各因素与是否就业的相关性。

文档评论(0)

liwenhua11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档