中国人民大学--非参数统计(PPT-34)第六章分类数据的关联分析.ppt

中国人民大学--非参数统计(PPT-34)第六章分类数据的关联分析.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 分类数据的关联分析 本章内容 列联表和 检验 独立性检验 例6.1 齐性检验 例6.2 解答 Fisher精确检验 检验 例6.3 Ridit检验 Ridit得分定义 计算步骤 检验 检验 例6.4 解答 对数线性模型 二维饱和对数线性模型 二维独立对数线性模型: 例6.5 首先:计算年龄和对缺水意见的交互作用,如表所示: 模型设计矩阵 模型估计检验 高维对数线性模型 例6.6 解答 本章要求 掌握分类数据的独立性研究方法; 区分分类数据的独立性和齐性检验的异同; 掌握Fisher检验与卡方检验的应用条件的异同; 了解Ridit方法和应用; 了解对数线性模型和卡方检验的异同; 熟练应用S-Plus中的相关命令学习如上方法。 假设检验问题: 当 取大值,或者p-值很小的时候,拒绝零假设。 构造统计量: 假设检验问题: 构造统计量: 在零假设下近似有: 检验方法和独立性检验相同。 n.. n.1 总和 n2. n1. n12 总和 2*2列联表 在A、B独立时: n22 n.2 n11 n21 任何一个格子中的的数目都不会过大或者过小,如果过大过者过小就可以考虑拒绝零假设,因而我们考虑 就可以了。当大样本时,可以采用近似正态分布进行检验,即: Ridit检验法的原理:取一个样本数较多的组或者将几组数据汇总成为参照组,根据参照组的样本结构将原来各组响应数变换为参照得分:Ridit得分,利用变换以后的Ridit得分进行个处理之间的强弱比较。 行向量A表示不同比较组,列向量B为顺序尺度变量,假设 , 表示对应格子的响应频数。 假设检验问题: 假设顺序类别B中第j类的边缘分布是 , j=1,…,s,那么第j类的顺序强度(Ridit得分)定义如下: 其中 在实际计算中用样本估计 . 根据计算的R构造检验统计量: 当大样本时,T值接近于1,从而检验统计量简化为: 在零假设情况下,W近似服从 分布,当W过大或者过小的时候,都考虑拒绝零假设。 对数线性模型是把列联分析和线性模型统一起来的研究方法,它强调了模型拟合优度,交互效应和网格频数估计。 二维饱和对数线性模型: 其中: 二维独立对数线性模型: 其中 接着:计算年龄和对缺水意见对数作用,如下表所示: 表达为矩阵形式,可以方便进行参数估计和检验。 4个参数 , ,则饱和对数线性模型可表示为: 其中: 建立对数线性模型之后,对于模型需要进行检验,常见的统计量由两个,Pearson 和对数释然比统计量: 在零假设下,两者近似服从 ,k是模型独立参数个数。 高维列联表对数线性模型,用 三维表为例。A有r格水平,B有s个水平,C有l个水平, 为观测频数, 是概率真实值。则对数线性模型一般表示为: 其中:

您可能关注的文档

文档评论(0)

sanshengyuan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档