[管理学]第十二章 变量间关系分析.pptVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[管理学]第十二章 变量间关系分析

定性和定量变量间的混和关系 前面就是一个所谓的三维列联表(contingency table). 这些变量中每个都有两个或更多的可能取值。这些取值也称为水平;比如收入有三个水平,观点有两个水平,性别有两个水平等。该表为3?2?2列联表 定义:将一个变量值与另一个变量值在表格里进行交叉分类,称为列联表或者交互分类表(软件中一般缩写为crosstabs) 列联表的中间各个变量不同水平的交汇处,就是这种水平组合出现的频数或计数(count)。 二维的列联表又称为交叉表(cross table)。 列联表可以有很多维。维数多的叫做高维列联表。 注意前面这个列联表的变量都是定性变量;但列联表也会带有定量变量作为协变量。 列联表的结构 列联表的结构 列联表的分布 边缘分布 行边缘分布 行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人 列边缘分布 列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为100人,120人,90人,110人 条件分布与条件频数 变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布 每个具体的观察值称为条件频数 百分比分布 条件频数反映了数据的分布,但不适合进行对比 为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布 行百分比:行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比:列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n ) 期望频数的分布 假定行变量和列变量是独立的 一个实际频数 fij 的期望频数 eij ,是总频数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即 ?根据上述公式计算的前例的期望频数 ? 相关系数 测度 2?2列联表中数据相关程度的一个量 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 ? 相关系数 一个简化的 2?2 列联表 列联相关系数 用于测度大于2?2列联表中数据的相关程度 计算公式为 C 的取值范围是 0?C1 C = 0表明列联表中的两个变量独立 V 相关系数 计算公式为 V 的取值范围是 0?V?1 V = 0表明列联表中的两个变量独立 V=1表明列联表中的两个变量完全相关 当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=? 列联表中的相关测量(一个实例) 【例】一种原料来自三个不同地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。分别计算?系数、C系数和V系数,并分析相关程度 列联表中的相关测量 (一个实例) 解:已知n=500,根据计算??=19.82,列联表为3?3 结论:三个系数均不高,表明产地和原料等级之 间的相关程度不高 第三节 皮尔逊相关系数 解:根据样本相关系数的计算公式有 人均国民收入与人均消费金额之间的相关系数为 0.9989 由于观察频数的总数为n ,所以f11 的期望频数 e11 应为 ? 例如,第1行和第1列的实际频数为 f11 ,它落在第1行的概率估计值为该行的频数之和r1除以总频数的个数 n ,即:r1/n;它落在第1列的概率的估计值为该列的频数之和c1除以总频数的个数 n ,即:c1/n 。根据概率的乘法公式,该频数落在第1行和第1列的概率应为 期望频数 实际频数 期望频数 实际频数 31 33 75 32 反对该方案 37 30 40 34 60 57 三分公司 73 80 66 79 四分公司 75 二分公司 一分公司 68 赞成该方案 对列联表相关测量的工具: 卡方; ? 相关系数 列联相关系数 V 相关系数 第三节 相关的测量 卡方的计算: 观测频数:即实际调查得到的,或者案例给出的数据 期望频数:即假设应该出现的数据 用于检验列联表中变量之间是否存在显著性差异,或者用于检验变量之间是否相关 0.0606 0.3125 0.1500 0.4932 0.1176 0.6250 0.3000 0.9730 (fij- eij)2 f 2 -5 -3 6 -2 5 3 -6 fij - eij 4 25 9 36 4 25 9 36 66 80 60 73 34 40 30 37 68 75 57 79 32 45 33 31 (fij - eij)2 期望频数 (eij) 实际频数 (fij) 合计:3.0319 …..接上例 n = 2 c j n b + d a + c 合计 c + d d c y2 a + b 合计 b x2 x1 a y1 因素 X 因素 Y 将??

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档