语言统计第十二章-卡方检验.pptVIP

下载本文档

2
0
约2.17千字
约 28页
2024-08-19 发布于北京
举报
版权申诉

语言统计第十二章-卡方检验.ppt

1、本文档共28页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

;计算卡方值的基本公式为

;卡方检验的零假设是：实际次数与期望次数之间没有差异，但是对于不同的用途（见下面的讨论），零假设的陈述方法略有不同。卡方检验一般是双尾检验，即其备择假设为：实际次数与期望次数之间有差异（不指出差异的方向）。当然，如果需要，也是能进行单尾检验的，只要把双尾检的显著水平减半即可。附表10中给出了对应于不同显著水平和自由度的χ2的临界值，如果计算出的χ2值（检验统计值）大于或等于临界值，就推翻零假设。;第三节卡方检验的用途;例如，在一个关于高考标准化试验的问卷调查中，有这样一个问题：

大量采用客观选择题不利于考察学生的创造思维能力，我对这种观点：

A.同意B.一般C.反对

在所调查的500人中，有250人选在所A，150人选B，100人选C（实际次数），那么选择三个答案的人数有没有显著差异呢？

假如它们之间没有差异，那么500个被调查者在三个答案上的次数分布就应是一样的，即500/3=166.7，这是期望次数。实际观察到的次数与根据假设所期望的次数是否吻合呢？

;这里只涉及一个变量，即对问题的回答情况，分成三个范畴或三组。我们将有关数据整理成表12.1

;在该例中，各组期望次数相等。对于这种情况，我们可以把公式(12.1)稍加改变，得出一个简便计算公式。;这与用公式（12.1)所计算出的χ2值基本上是一样的（少量误差是由小数点进位所致）。

适合性检验的χ2值的自由度是组数，本例中的数据被分为三组，所以自由度;设显著水平α为0.05，查卡方分布表（附表10），得临界值5.99。由于检验统计值χ2大于临界值，所以应推翻零假设，说明三种选择的实际次数与期望次数有显著差异，因而说明被调查者对此问题的态度是有倾向性的（从表中数据可以看出，被调查者更倾向于赞成问卷题中所提出的观点）。;二、正态性检验;用卡方检验进行的正态性检验其实也是一种适合性检验，即检验实际次数分布与期望次数分布是否有显著差异。这里实际次数是指样本各组数据的实际次数分布，期望次数是指在假设样本来自正态总体的情况下各组数据所应该具有的次数。如果实际次数与期望次数没有差异或差异很小，就说明样本碗实来自正态总体；如果两者的差异显著，就说明样本所来自的总体分布不是正态。;在进行正态检验之前，首先要把样本数据整理成分组次数分布表，其中第一列为数据的分组，第二列为每组的实际次数O。然后，假设样本来自的总体呈正态分布，计算每组的期望次数，这是正态检验的关键。期望次数的计算步骤如下：

第一步：计算样本的平均值与标准差。

第二步：把每组的上限转换成标准分Z（即上限离开平均值的标准差单位数），并从正态分布表中查出对应的正态曲线下的面积A。

第三步：求每组的面积，该面积就是每组的期望次数的比例P。;第四步：用每组期望次数的比例乘以样本容量（即P×N),即得每组的期望次数E。需要特别注意的是，如果某组的期望次数低于5，就要与邻组的期望次数合并，直到合并后的期望次数等于或大于5，否则，就会影响卡方检验的可靠性。

求出期望次数之后，就可用公式（12.1）计算χ2值。最后，根据设定的显著水平和自由度，查卡方分布表，以确定检验是否有显著意义。这类正态性检验的自由度为组数减3。

;三、独立性检验;列联表的行的数目一般用r表示，列的数目用k表示，因此一个列联表就可表示为r×k个。根据行和列的多少，列联表可以有2×2，2×3，3×3等多种形式。例如一个2×3的列联表是这样的：;独立性检验的步骤如下：

第一步：陈述零假设：两个分类标准完全独立。

第二步：设显著水平α。

第三步：假定零假设成立，计算每一个格里的期望次数E，方法是：

用一个格所在的行总计乘以其所在的列总计，然后除以样本容量。公式为;例如上表中的第一格A的期望次数为（A+B+C）×（A+D）/N；第二格B的期望次数为（A+B+C）×（B+E）/N；第四格的期望次数为（D+E+F）×（A+D）/N，等等。按惯例，期望次数一般放在括号内，置于实际次数之后。

第四步：用公式（12.1）计算χ2，即先计算每一格的，然后再把各格的结果累加。

第五步：确定自由度：即行的数目减1乘以列的数目减1。

第六步：在卡方分布表中查对应于α和df的临界值。如果χ2大于临界值，就推翻零假设。

;第四节亚茨校正法;具休校正方法是将公式（12.1）中的改为，即

您可能关注的文档

文档评论（0）

bookst + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

语言统计第十二章-卡方检验.pptVIP