第二章 定性数据的卡方检验.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 定性数据的卡方检验

检验 2.3 一致性检验 2.4 拟合优度检验 用 检验进行列联表分析是一个有力的工具,实际上, 检验也可用于总体的分布检验。 用 检验进行总体的分布检验,关键是将总体的取值进行分类。如果总体只取有限个值,则就去每一个值作为一类。如果总体取无限个离散值,则通过适当合并,变成只取有限个值的类。 合并的原则是使合并类中的每一类的实际数等于或超过5,如果总体是一连续总体,则将总体的取值范围分成有限个类,分类的原则仍然是使每一类中的期望频数等于或超过5。通过分类,将分布检验问题转变成分类数据的检验问题。通过下面例子,具体来说明检验的步骤。 选择 ,打开 对话框。把[Days]放入Frequency栏中,单击OK。 从 打开Chi-Squaretest对话框,把[Cancel]选入Test Variable List栏中,ExpectedValues栏中选择Values选项,并把表3—14中合并后的理论频数逐个输入他的右边的输入框中,每输入一个值后“Add”按钮,直到输完所有的理论频数为止,最后单击OK. 结果输出 结果分析 前一表显示的是观察频数和理论频数以及它们之间的差异,从后一表中可以看出 ,与上述计算结果基本一致,p=0.991α=0.05,因此没有充分理由拒绝“每日注销的房间数遵从泊松分布”的零假设。 LOGO 第二章 定性数据的 检验 2.1 多项分布与 检验 2.2 列联表分析 2.3 一致性检验 2.4 拟合优度检验 2.1 多项分布与 检验 问题的提出 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。 但是统计学中是要分析的数据大多是针对具有某一计量单位的计量数据,诸如重量、时间、长度、强度、钱数等。市场调查中,而要分析的数据往往不是由计量值构成,而是由频数构成。因此计算出不同分类的频数分布,为深入分析这些定性资料奠定基础。也是现实对我们提出的要求。 本章的目的是提高定性资料的分析水平,主要介绍定性数据的列联表分析和 检验在实际统计分析中的应用。 多项分布与 检验 收集分类数据的目的是分析在各个类中数据的分布。 例如,我们为了估计消费者中喜欢三种牙膏中每一种的比例,则统计购买这三种品牌牙膏的顾客购买每一种的人数。在这里仅仅是根据牙膏的种类来分类,我们称之为一维分类或一向分类。而顾客的投资倾向与职业的关系中,分类是按投资倾向和职业两个方向进行分类,我们称之为二向分类或列联表。 【例2.1.1】某超市为了研究顾客对三种品牌矿泉水的喜好比例,以便为下一次进货提供决策,随机观察了150名购买者,并记录下他们所买的品牌,统计出购买三种品牌的人数,如下表: 36 53 61 人数 丙 乙 甲 品牌 顾客购买喜好调查 这些数据是否能够说明顾客对这三种矿泉水的喜好确实存在差异? 为了解决这个问题,我们需要知道这些分类分布。由于该问题有甲、乙、丙三类,所以,这个分布称为多项概率分布,简称多项分布。 多项分布是二项分布的推广,可以看成是多项试验得到的分布。多项试验有如下一些性质: 1. 多试验由n个相同的试验所组成。 2. 每个试验的结果落在k组的某一组中。 3. 某个试验的结构落在某一特定组,比如说组i中的概率为 且在试验之间保持不变,且有 。 4. 试验是独立的。 5. 实验者关心 这里 等于试验结果落在组 中的数目。注意: 在多项实验中,当k=2时,就得到二项试验。 在大多数实际情况中,k个可能结果的概率 通常是未知的,我们的目的就是要对它们进行判断。 基本思想:实际频数与理论频数的符合程度,即差别是否由抽样误差引起的。 用途:分类计数资料的假设检验,检验两个或多个总体率或构成比有无差别。 H0(无效假设):总体参数没有差别 检验统计量: 对例1来说,我们希望去检验顾客对这三种品牌的矿泉水的喜好是否确实存在差异,可以考虑检验零假设为对三种品牌的喜好没有差异,对立假设

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档