第十六章卡方检验 PPT课件.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十六章卡方检验 PPT课件

第十六章 卡方检验 第一节 卡方检验的原理 数据的类型与列联分析 ??检验的别称 ??检验又叫列联表分析或交叉表分析、表中的单元格内可以是计数的次数也可以是百分比,所以又可以称为百分比检验。 ??检验分析计数数据的时候,对计数数据的分布形态不作任何假设,因此视为非参数检验的一种。 卡方分布 χ2分布是由正态总体随机抽样得来的一种连续型随机变量的分布。 设有一平均数为μ、方差为σ的正态总体。现从此总体中独立随机抽取n个随机变量:x1、x2、…、xn,并求出其标准分数: 记这n个相互独立的标准分数的平方和为 χ2,它们服从卡方分布。若用样本平均数代替总体平均数μ,则随机变量 卡方分布的特点 χ2分布是由正态总体随机抽样得来的一种连续型随机变量的分布。 1、显然, χ2 ≥0,即的取值范围是[0,+∞?;分布密度曲线是随自由度不同而改变的一组曲线。 2、如果df2,这时候卡方分布的平均数: u χ2 =df ,方差σ2χ2 =2df 3、随自由度的增大,曲线由偏斜渐趋于对称;df≥30时, 接近平均数为 的正态分布。 4、 χ2 分布是连续分布,但有些离散型分布也近似χ2 分布。 一、 ??检验的假设 1、分类相互排斥 2、观测值相互独立(可能会常常违背) 3、期望次数的大小 每一个单元格中的期望次数至少在5个以上。如果自由度较大,简单处理方法是每个类别的理论次数不能小于1、 20%的类别理论次数不小于5 检验某个样本的性别比例和理论比例是否一致 这个差异是属于抽样误差、还是比例发生了实质性的变化?要回答这个问题, 首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。为了避免正、负抵消,可将差数平方后再相加,即计算∑(f0-fe)2,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。但利用∑(f0-fe)2表示实际观察次数与理论次数的偏离程度尚有不足。 例如某一组实际观察次数为505、理论次数为500,相差5;而另一组实际观察次数为26、 理论次数为21,相差亦为5。显然这两组实际观察次数与理论次数的偏离程度是不同的。因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为,即 ??检验的公式 基本公式 第二节 配合度检验 又称拟和检验,一般是单向表的卡方检验。 一、配合度检验的一般问题 (一)统计假设 H0: fo-fe= 0 H1: fo-fe ≠0 ( 二)自由度的确定 一般为资料分类或分组的数目,减去计算理论次数时候所用统计量的个数 (三)理论次数的计算,一般将理论概率乘以总数 二、配合度检验的应用 (一)、检验无差假说 (二) 、检验假设分布的概率 三、连续变量分布的吻合性检验 (五) ??连续性校正(不考) 当df=1,其中只要有一个组的期望次数小于5,用??检验计算出来的得出的概率偏小,要有耶茨连续性校正法校正,将实计数和理论次数的差的绝对值减去0.5再计算 当自由度大于1时,直接计算的结果的分布与连续型随机变量分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。 第三节 独立性检验 主要用于两个或者两个以上因素多项分类的计数资料的分析,研究两个变量之间的相关性或称独立性的问题 配合度检验和独立性检验的区别 (一)独立性检验的次数资料是按两因子属性类别进行归组。根据两因子属性类别数的不同而构成2×2、2×c、r×c列联表(r为行因子的属性类别数,c为列因子的属性类别数)。而配合度检验只按某一因子的属性类别将如性别、表现型等次数资料归组 (二)配合度检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。 独立性检验(要点) 检验列联表中的行变量与列变量之间是否独立 检验的步骤为 提出假设 H0:行变量与列变量独立 H1:行变量与列变量不独立 计算检验的统计量 一、统计检验的一般问题与步骤 (一)统计假设 (二)理论次数的计算 (三)自由度的确定 (四)统计检验方法 方法要看具体情况定 一般是 二、四格表(2×2列联表)的独立性检验 (一)独立样本四格表的??检验 1、如果理论次数都大于5,可以用??的基本公式, 也可用简洁公式如下 它还可以用

文档评论(0)

dajia1qi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档