- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
皮尔逊检验
PAGE
PAGE 42
第10章 皮尔逊检验
教学目的与要求:通过本章教学,使学生了解皮尔逊检验适用的场合,了解怎样用皮尔逊统计量检验一个频数分布是否来自正态总体,掌握用皮尔逊统计量对列联表资料作独立性检验的方法。
重点内容和难点:
1.皮尔逊统计量的一般形式
2.皮尔逊检验适用的场合
3.用皮尔逊统计量作分布拟合检验
4.对列联表资料的独立性检验
§10.1 皮尔逊统计量
1.统计量的提出: 对于样本资料被整理成频数分布形式,要检验实际频数与理论频数是否较为接近,这样的问题,统计学家卡尔·皮尔逊提出如下检验统计量
= (10.1)
并证明它近似服从自由度为=组格数-估计参数个数-1的分布。
式中,是样本量,理论频数是由样本量乘以由理论分布确定的组格概率计算的。
求和项数为组格数目。
2.皮尔逊统计量的直观意义:是各组格的实际观测频数与理论期望频数的相对平方偏差的总和,若值充分大,则应认为样本提供了理论分布与统计分布不同的显著证据,即假设的总体分布与总体的实际分布不符,从而应否定所假定的理论分布。所以,应当在分布密度曲线图的右尾部建立拒绝域。
3.应用皮尔逊统计量时要注意下列问题:
1.当n充分大时,近似服从分布,因此,皮尔逊统计量要在大样本的情形下应用。
2.各组格的理论频数不应太小。一般,每一组格的理论频数都不应小于4,否则应将小于4的组并入其他组。但是,具体应用时这一限制可以放宽:(1)若自由度不小于60,则可以不加限制;(2)若自由度不小于6,则个别理论频数不得小于0.5即可;(3)若自由度等于2,则各理论频数不应小于2;(4)若自由度等于1,则各理论频数不应小于4。
§10.2 分布拟合检验
1.问题的提出:当无法根据所作随机试验认定无限总体符合何种概率分布模型时,便需要根据统计数据提供的信息,为总体选配一个合适的概率分布模型,并进行检验。
2.一般作法是:
(1)根据研究目的和任务搜集样本数据,并计算出样本平均数和
标准差。
(2)将搜集到的样本资料进行组距式分组,并得到实际频数。
(3)对各组组距进行标准化处理,并计算出各组的概率。
(4)用样本容量乘以各组的概率,得到各组的理论频数。
(5)进行检验:a。提出假设服从正态分布
不服从正态分布
b.构造统计量
c.给定显著性水平,确定临界值
d.作出结论是接受原假设还是拒绝原假设。
§10.3 列联表资料的独立性检验
1.概念:按两个分组标志对样本作双向复合分组整理所得到的频数分布表称作列联表。如下表
228人样本按性别和对促销的反应复合分组的人数
分组标志(对促销的反应)合 计能激起购买欲望
(组号)不能激起购买欲望
(组号)分组标志
(性别)男(组号)=60女(组号)合计 表中有2行、2列,称作表或四格表。一般地,行、列的列联表称作表。
2.变量的类型:作列联表分析时,通常把两个分组标志区分为自变量和因变量。
3.分析的任务:研究这个变量之间是统计独立还是统计相依。于是,原假设为:性别与对促销的反应独立;备择假设为:二者不独立。
4.本章与上章的区别:上一章介绍的检验也回答变量间是否独立的问题。不同的是:在上一章,因变量是必须数量型变量,自变量可以是数量型变量,也可是品质型变量,而在本章,因变量与自变量都是是属性变量。
一、概率分布表
概率分布表,如
性别与对促销的反应联合发生的组格概率
1二、用概率分布表计算各组格理论频数
随机试验中的任意一人进入左上角组格的概率是,于是,观察228人,其中进入左上角组格的人数服从参数为的二项分布,而二项分布变量的期望值即进入左上角组格人数的期望值为,这就是左上角组格的理论频数。类似地可以得到其他三个组格的理论频数。于是我们得到下面的理论频数表
用组格联合概率计算组格期望频数
三、用概率分布表的记号来表示原假设和备择假设
原假设:性别与对促销的反应独立,备择假设:性别与对促销的反应相依。
也可将原假设和备择假设应写作
:
:
四、在成立的假定下计算各组格理论频数
把:代入上表的各个组格,得到下面的表
成立假定下的组格理论频数
五、皮尔逊统计量用于列联表资料的独立性检验
为了检验成立假定下的
文档评论(0)