(八章)第三节显著性检验——2检验.pptVIP

(八章)第三节显著性检验——2检验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(八章)第三节显著性检验——2检验.ppt

(八章)第三节 显著性检验——?2检验 * * ?2检验概述 运用调查法得到的数据大多是计数数据,即按一定属性分类调查所得的数据,属于总体分布不详(是否呈正态分布)的间断性数据。对于这种计数数据的差异显著性检验就要用?2检验 (样本所属总体呈正态分布的连续性数据——计量数据的检验用u检验、t检验和F检验) ?2的概念 是各组实际观察次数(实得次数)与理论次数(期望次数)之差的平方,除以理论次数所得比率的总和 是反映实得次数与理论次数的差异程度的最好指标 计算公式: ?2越大,说明实得次数与理论次数相吻合的程度越低,即样本分布与假设的理论分布越不相一致; ?2越小,说明实得次数与理论次数的吻合程度越高,即样本分布与假设的理论分布越相一致 所以利用可以度量观察次数与理论次数的差异程度 ?2分布于?2值表 ?2分布 从同一总体中抽取出若干容量相同的样本,每个样本都可以计算出一个?2值,这样许多的?2值就组成一个?2分布。据此绘出次数分布图,就得到一条光滑的曲线即?2分布曲线。 分布曲线以自由度为转移,自由度不同,分布曲线也就不同。 ?=1 ?=3 ?=4 ?=6 ?=2 ?=10 ?=20 ?=30 ?=50 从图中可以看出分布曲线有以下特点: 1.?2分布是一个正偏态分布。自由度df很大时接近正态分布。df→﹢∞时,分布即为正态分布。可见正态分布是?2分布的一个特例。 2. ?2的值都是正值。 3. ?2分布的和也是?2分布。即分布具有可加性。 ?2检验的主要用途 检验的用途较多,主要有两点: 1.进行各种适合性检验。即检验各种实得数据与理论数据相吻合。 2.进行各种独立性检验。即检验计数数据的分组属性是相互关联还是彼此独立。 ?2的一般步骤 一步:设立虚无假设与备择假设。如 H0:无效假设 f0= fe f0 为实得次数 H1:备择假设 f0≠fe fe 为理论次数 二步:计算理论次数,求出?2值 三步:根据df 和选定的显著性水平a(通常选为0.05, 0.01, 0.001),从值表中查出相应的?2临界值。 四步:将计算出的?2值与查表得到的?2临界值相比较。 若?2值大于表中的临界?2值,就拒绝虚无假设H0 ,从而选择备择假设H1 ;如果?2值小于表中的?2临界值,则接受H0 ,拒绝H1 ,即差异不显著。 具体判断规则与表示方法如下: *** P ≤0.001 ?2≥?2(df)0.001 有极其显著差异 ** P ≤0.01 ?2(df)0.01≤ ?2 ?2(df)0.001 有非常显著 差异 * P ≤0.05 ?2(df)0.05≤ ?2 ?2(df)0.01 有显著差异 无 P 0.05 ?2?2(df)0.05 无显著差异 符号 表示方法 与临界值比较 结论 适合性检验 一个样本包含两组或两组以上得到适合性检验,即教材的单项表?2检验 例一: 从学生中随机抽取80人,49人喜欢,31人不喜欢。问该校学生喜欢上体育课和不喜欢体育课人数是否相等? 1.设立虚无假设和备择假设 H0:喜欢和不喜欢的人数无显著差异 H1:欢和不喜欢的人数差异显著 2.计算理论值,求出?2值 fe喜欢=fe不喜欢=80/2=40 31(40) 49(40) 不喜欢f0 ( fe ) 喜欢f0 ( fe ) 将上表中的数据代入公式得: ?2=(40-40)2 /40+(31-40)2/40 =2.025+2.025 =4.05 3.根据df 和选定的显著性水平a查?2临界值 df =组数-1=2-1=1 查表得 ?2(1)0.05=3.84 ?2(1)0.01=6.64 4.比较计算得到的?2值?2临界值,得出判断: 3.844.056.64 所以拒绝H0,接受H1。 结论为:该校喜欢上体育课和不喜欢体育课的学生人数显著的不相等。 例二(教材144) 问有无显著差异,先对比显著性水平a在0.05的临界值,大于则有显著差异,再对比显著性水平a在0.01的临界值,还大于则结论为非常显著的差异。 练习作业: 从学校教职工中随机抽取84名进行新课改方案的民意测验,其中38人赞成,21人反对,25人不表态。问持各种态度的人数有无显著差异? 独立性检验——2*2列联表和m*n列联表的?2检验 一、2*2列联表的独立性检验 把样本按照两种属性分类,每种属性又都分为两类,从而排成两行两列的表,也称四格表,属于最简单的列联表,借此可以研究两种属性之间的关系,即检验两种属性之间是彼此独立的还是相互关联的。 现假定A属性可分为

文档评论(0)

maritime5 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档