第4章二维列联表(免费阅读).ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
不完备列联表 对不完备列联表中元素的估计,可以在假定完全随机泊松分布的基础上,得到似然方程组: 在保持边缘和不变的前提下,解出期望频数。 有的情况下期望频数的极大似然估计难以直接得到,需要通过迭代算法求解。 迭代算法就是在保持边缘和不变时,寻找 放入不完备列联表的非空格中,也就是满足以上方程组成立。 迭代估计法 迭代算法的步骤: 1、令非空格上的期望频数估计的初始值为1, 2、调整该估计值,令: 3、继续调整以上估计值,令: 迭代估计法 4、将第二次迭代得到的值作为初始估计,重复前面的步骤2和步骤3; 5、直至相邻两次迭代得到的估计仅有比较小的差别,最后得到的迭代估计就是期望频数的极大似然估计。 以上步骤可以在表格上完成,每次估计所有非空格的迭代值,直到精度符合要求即可。 不完备列联表期望频数的ML估计除上述迭代法外,还可以通过对数线性模型法,借助统计软件进行估计。 不完备列联表的检验 对拟独立的不完备列联表的ML估计后,需要进行拟独立性检验;同时,考虑不完备子集的拟独立性也是研究完备表的一种方法。 原假设应为: 检验统计量为: 第四章 二维列联表 二维列联表 假设将n个个体按属性A和B分类,属性A有r类,属性B有c类,就形成了一张二维的r×c列联表。 二维列联表 与四格表相类似,二维列联表同样有四种不同的抽样方式。 其中,单侧给定、总的样本容量给定和完全随机三种情况较为常见,且这三种抽样方式下的检验方法完全相同。 独立性与齐性 如果对任意的i和j,都有: ,则称属性A与B独立。 如果A与B独立,则对任意j都与i无关 如果A与B独立,则对任意i都与j无关 独立性与齐性 此时,称属性A与B有齐性关系。 齐性关系描述了Ai类中Bj的条件概率完全相同,或在Bj 类中Ai的条件概率完全相同。 因此,对于二维列联表属性A与B相互独立,等价于二者之间有齐性关系。 需要指出的是,在四格表中相互独立等价于不相关,可以用相关系数描述二者的关联程度。但在二维列联表中则不能使用。 二维列联表的独立性检验 二维列联表独立性检验实质上是带参数的分类数据的检验问题。 二维列联表的独立性检验 【例4.1】为了解男性和女性对三种啤酒的偏好差异分别调查了1353个男性和636个女性,结果见表: 问男性与女性对啤酒的偏好是否有显著差异。 二维列联表的独立性检验 通过计算检验统计量的值得到: 说明男性与女性对啤酒的偏好有显著差异 可见,独立性问题的讨论仅仅是说明属性A与B有无关系,或是否相互独立,但不能给出关系的方向与强弱。 相合性的度量与检验 相合性用来描述属性变量之间的相关情况,包括关联的方向和强度。 二维列联表根据属性的类型分为三类: 双向无序列联表 一向无序、一向有序列联表 双向有序列联表 实际上即使无序也可以定义为有序,或假设有序。这样,相合关系有两类: 正相合:属性A大的个体,属性B也往往较大; 负相合:属性A大的个体,属性B往往较小; 相合性的度量与检验 在四格表中,用来判断属性A与B关联情况(相合性检验)的统计量U、χ2均包含一个共同因子: n11n22-n12n210时,四格表正相合; n11n22-n12n210时,四格表负相合; 有序属性数据相合关系的度量: Pearson的矩相关系数 Spearman的等级相关系数 Kendall的τ相关系数——使用最多 相合性的度量与检验 τ相关系数基本思路: 认为二维列联表均可定义为有序表; 对有序变量的赋值可以确定由小到大的顺序关系,但不影响相合关系的度量;最简单的赋值方法就是令 在二维表中, 相合性的度量与检验 在不考虑同分对的情况下,τ系数以数据对中同序对与异序对的差为分子,以样本容量n可能形成的总数据对数为分母;即 其中:在二维表的任意两个单元格之间,若: 同序对: 异序对: 同分对: 相合性的度量与检验 同分对可以有三种类型 属性A方向的同分对,即行等级或顺序相同的数据对,记为TA ; 属性B方向的同分对,即列等级或顺序相同的数据对,记为TB ; 属性A与B的同分对,即行顺序与列顺序相等的数据对,记为TAB ; 因此有, 相合性的度量与检验 从τ系数的计算公式可知,在属性A与B正相合时,G 比较大而H 比较小;反之在A与B负相合时, G 比较小而H 比较大。因此,(G-H)的方向决定了相合性的方向。 在存在同分对的情况下,需要对相合性的度量进行修正。 相合性的度量与检验 τ系数的取值范围为[-1,1]之间 当H=0,且TA=TB=TAB时,完全正相合; 当r=c时,τ=1; 当G=0,且TA=TB=TAB时,完全负相合; 当r=c时, τ=-1; 当TA=TB=TAB时,说明每一行、每一列只有一个非零

文档评论(0)

zilaiye + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档