应用统计学统计描述.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 期望频数含义:遵从总体分布比例 行列数与检验水平确定时,卡方界值是唯一的:服从自由度为(r-1)×(c-1)的近似卡方分布 P值:出现此卡方值以及更极端情况的概率 自由度:当行列边缘分布确定时,计算期望分布时能自由取值的格子数。υ= (r-1)×(c-1) * Chi-square复选框:计算X2值。 Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。 Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。 Contingency coefficient复选框:即列联系数,其值界于0~1之间; Phi and Cramers V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramers V 则界于0~1之间; Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差; Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。 Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。 Gamma复选框:界于0~1之间,所有观察实际数集中于左上角和右下角时,其值为1; Somersd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例; Kendalls tau-b复选框:界于-1~1之间; Kendalls tau-c复选框:界于-1~1之间; Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例; Kappa复选框:计算Kappa值,即内部一致性系数; Risk复选框:计算比数比OR值; McNemanr复选框:进行McNemanr检验(一种非参检验); Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量(分层X2,也有写为X2CMH的),可在下方输出H0假设的OR值,默认为1。 * 因为卡方分布是连续性分布,单元格较多时,分类数据的不连续分布可近似卡方分布,但单元格少时,必须进行Yates连续性校正。 * * 连续性校正:自由度为1时。因为卡方分布是连续性分布,单元格较多时,分类数据的不连续分布可近似卡方分布,但单元格少时,必须进行Yates连续性校正。 确切概率计算法:依据超几何分布计算条件概率。应用条件:T5 and n40;or T1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! * 总体的特征 对城乡储户分析: 对未来收入情况分析 * 似然率卡方:20%的单元格期望频数小于5时 Mantel-Haenzel卡方:线性相关检验:行、列变量均为有序变量,且按顺序排列时。计算线性相关程度。 * Phi and Cramers V复选框:Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramers V 则界于0~1之间; Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差; Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。 * 均为两变量相关检验中的非参数方法 * 这类变量不常用交叉表分析 * Risk分析:仅用于四格表,可给出医学统计中的相对危险度和比值比 * 第107页: * * * 二分法选择Dichotomies;分类法选择Categories,并列出取值范围。 * * * 117页公式 * * 例2:城乡储户对“未来收入的变化趋势”的态度是否相同 3、行列变量的关联度分析 该关联度类似于参数检验中相关系数的含义,取值多在(-1,1)区间 可描述行列变量的关联强度,多数是对Pearson卡方测量值进行的修正。 为两变量相关研究中的非参数方法,卡方检验中的关联度分析不太常用。 3.1、两定类变量的关联度 列联系数(Contingency coefficient):取值0~1,其取值随着行列数的增加而增大 Phi系数:取值-1~1,适用于四格表,对样本量进行了修正 V系数:取值0~1,对样本量和行列数进行修正;四格表时,等于Phi系数 例:居民储蓄调查中了解城乡户口与“买东西还是存钱合算”的关联度 3.2、两定序变量的关联度 同序对数(P)、异序对数(Q)

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档