对二维离散型随机变量.docVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对二维离散型随机变量 这是很少关注数量本身的值(即少用描述性统计量去刻划),更关注变量间的关系 假设检验: 变量间的共有关系(离散型变量取值为名义值和顺序值时均可考虑这些问题): 独立性 条件分布是否相同(与某种因素无关) 变量间的特殊关系(离散型变量取值顺序值时可考虑这些问题) 相合性 (指两个取顺序值的离散随机变量间,取值顺序间有关系,要么一致(正相合),要么不一致(负相合)) 一致性(前提是在方表中,指倾向性是否一致,对应的次序一致) 边缘分布是否相同(齐性检验,), 对称性(表明两个因素水平间的作用相同) 1.在四格表中, 不相关与独立性等价; 独立性与条件概率相等相互等价 边缘齐性和对称性相互等价(一般来讲,由对称性可导致边缘齐性,反之并不成立); 2.统计量:统计量和似然比检验统计量(高维表时为似然比统计量)。 3.边缘齐性检验:McNemar 检验 :(即:边缘分布相同)---用于配对数据的检验(方表) 4.Fisher精确检验的大样本形式的检验: Mantel Haenszel 检验 ::的检验,称为Mantel Haenszel 检验 5.相合性的测度: Kendall的系数 Gamma系数 Somers d系数(主要针对或列联表) 6.方表一致性检验: Kappa系数 7.高维表的检验: 条件相合性的检验: Cochran-Mantel-Haenszel检验 条件相合程度的检验: Breslow-Day检验 独立与不相关 四格表的概率表 独立性定义为:, (1) 属性A和B相互独立(条件概率相等):,其中, 属性A和B相互独立与独立性相互等价 下面说明,这两种独立性是等价的.即(1)(2) (1)(2): ,,有 (2)(1): 由,即有,(此式也可作为属性A和B相互独立的定义) 又= = 同理有: 注:从上面的证明过程中可以看出,(1)中四个等式,只要一个成立,其余三个就成立,如成立,,则有,,成立. 不相关与独立性等价 下面对四格表进行一下调整,更具有教科书上的形式: 四格表的概率表 X 合计 合计 下面来求X,Y的协方差: = = = 若X,Y不相关,有,由,得,从而得独立性的定义. 所以,在四格表中,不相关与独立等价. 注:不相关与随机变量的取值无关.事实上令,则有,显然有: ,具有相同的相关系数.这时针对随机变量的计算就简单得多. 注:正如相关系数一样,它衡量了两个随机变量间线性关系的程度。如何衡量两个离散型随机变量的相关程度,很多统计学家们提出了不少的统计量,但多多少少还是有些缺陷。常用的衡量统计量是基于统计量的(对于相同的值,若样本容量不同,会造成检验的结果完全不一样,为了消除这种影响,解决的办法是用去除统计量): 系数 或 :缺点:没有象相关系数那样的特点,其值在[-1,1]之间,用起来并不方便。另外这个统计量的界为大于等于0,没有固定的上界。但这个量是下面几个统计量的基础。 的列联系数,这是Pearson于1904年提出的修正结果,并称之为列联系数(Coefficient of contingency)。其值在[0,1]内,且=0时,达到下界0,然而它不能达到其上界1。Kendall Stuart指出,即使在完全相关时,C值与表中的行,列数有关。 朱普洛夫系数,其特点为:完全独立时,取值为0,在完全相关,且行列数相等的情况下,其值为1(若行列数不等时,则不能达到上界值1--Kendall Stuart所说) 克雷莫(Cramer 1946) 其特点为:当为方表时(行列数相等的表),,在其他情况下有(当行列数差别不大时,这两个统计量的值相差不大) 注意:以上几个量均不具有概率的意义 Goodman Kruskal的度量: 思想:两个变量的关联程度可以考虑为:有关某一变量的分类知识能在多大程度上改善人们预测按另一变量分类情况的能力 其构造的过程如下:如在284个陆续住入精神病院的患者中按社会等级和诊断分类得如下频数表:(兴趣在于:知道一个人的社会地位,在多大程度上有效地预测他患病的类型?) 诊断(变量B) 神经病 抑郁症 人格异常 精神分裂症 社会等级 (变量A) 1 45 25 21 18 109 2 10 45 24 22 101 3 17 21 18 18 74 72 91 63 58 284 当不知道一个人的社会地位时:从上表可以看出,最可能得抑郁症(预测值为边际概率最大者) =

文档评论(0)

lingyun51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档