应用统计学统计描述.pptVIP

下载本文档

2
0
约1.17万字
约 88页
2017-06-25 发布于上海
举报
版权申诉

应用统计学统计描述.ppt

1、本文档共88页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * 期望频数含义：遵从总体分布比例行列数与检验水平确定时，卡方界值是唯一的：服从自由度为（r-1）×(c-1)的近似卡方分布 P值：出现此卡方值以及更极端情况的概率自由度：当行列边缘分布确定时，计算期望分布时能自由取值的格子数。υ= （r-1）×(c-1) * Chi-square复选框：计算X2值。 Correlations复选框：计算行、列两变量的Pearson相关系数和Spearman等级相关系数。 Norminal复选框组：选择是否输出反映分类资料相关性的指标，很少使用。 Contingency coefficient复选框：即列联系数，其值界于0～1之间； Phi and Cramers V复选框：这两者也是基于X2值的，Phi在四格表X2检验中界于-1～1之间，在R*C表X2检验中界于0～1之间；Cramers V 则界于0～1之间； Lambda复选框：在自变量预测中用于反映比例缩减误差，其值为1时表明自变量预测应变量好，为0时表明自变量预测应变量差； Uncertainty coefficient复选框：不确定系数，以熵为标准的比例缩减误差，其值接近1时表明后一变量的信息很大程度来自前一变量，其值接近0时表明后一变量的信息与前一变量无关。 Ordinal复选框组：选择是否输出反映有序分类资料相关性的指标，很少使用。 Gamma复选框：界于0～1之间，所有观察实际数集中于左上角和右下角时，其值为1； Somersd复选框：为独立变量上不存在同分的偶对中，同序对子数超过异序对子数的比例； Kendalls tau-b复选框：界于-1～1之间； Kendalls tau-c复选框：界于-1～1之间； Eta复选框：计算Eta值，其平方值可认为是应变量受不同因素影响所致方差的比例； Kappa复选框：计算Kappa值，即内部一致性系数； Risk复选框：计算比数比OR值； McNemanr复选框：进行McNemanr检验（一种非参检验）； Cochrans and Mantel-Haenszel statistics复选框：计算X2M-H统计量（分层X2，也有写为X2CMH的），可在下方输出H0假设的OR值，默认为1。 * 因为卡方分布是连续性分布，单元格较多时，分类数据的不连续分布可近似卡方分布，但单元格少时，必须进行Yates连续性校正。 * * 连续性校正：自由度为1时。因为卡方分布是连续性分布，单元格较多时，分类数据的不连续分布可近似卡方分布，但单元格少时，必须进行Yates连续性校正。确切概率计算法：依据超几何分布计算条件概率。应用条件：T5 and n40;or T1 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! * 总体的特征对城乡储户分析：对未来收入情况分析 * 似然率卡方：20%的单元格期望频数小于5时 Mantel－Haenzel卡方：线性相关检验：行、列变量均为有序变量，且按顺序排列时。计算线性相关程度。 * Phi and Cramers V复选框：Phi在四格表X2检验中界于-1～1之间，在R*C表X2检验中界于0～1之间；Cramers V 则界于0～1之间； Lambda复选框：在自变量预测中用于反映比例缩减误差，其值为1时表明自变量预测应变量好，为0时表明自变量预测应变量差； Uncertainty coefficient复选框：不确定系数，以熵为标准的比例缩减误差，其值接近1时表明后一变量的信息很大程度来自前一变量，其值接近0时表明后一变量的信息与前一变量无关。 * 均为两变量相关检验中的非参数方法 * 这类变量不常用交叉表分析 * Risk分析：仅用于四格表，可给出医学统计中的相对危险度和比值比 * 第107页： * * * 二分法选择Dichotomies;分类法选择Categories，并列出取值范围。 * * * 117页公式 * * 例2：城乡储户对“未来收入的变化趋势”的态度是否相同 3、行列变量的关联度分析该关联度类似于参数检验中相关系数的含义，取值多在（－1，1）区间可描述行列变量的关联强度，多数是对Pearson卡方测量值进行的修正。为两变量相关研究中的非参数方法，卡方检验中的关联度分析不太常用。 3.1、两定类变量的关联度列联系数（Contingency coefficient）：取值0～1，其取值随着行列数的增加而增大 Phi系数：取值-1～1，适用于四格表，对样本量进行了修正 V系数：取值0～1，对样本量和行列数进行修正;四格表时，等于Phi系数例：居民储蓄调查中了解城乡户口与“买东西还是存钱合算”的关联度 3.2、两定序变量的关联度同序对数（P）、异序对数（Q）