2上-统计作业期末练习1 chi_square1029.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 当 df =1 时,两个相关样本数据的四格表中,(A+D)<30或者(A+D)<50时(根据对检验结果要求的严格程度决定),应对χ2 值进行连续性校正。 (16.6) 应用校正公式计算χ2 值时,允许四格中有一格的实际频数出现零的情况。 χ2检验效应值 四个表 (2*2)矩阵的效应值: 大于2*2矩阵的效应值:Cramer’s V df* 指的是(r-1)或(c-1)中较小的那个 Contingency coefficient:列联系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为 其中,N为样本个数 练习1 习题2 (p.579) 红色 绿色 蓝色 黄色 21 11 18 10 练习2 一项研究调查了不同职业人群的价值取向,结果如下表。问人们所从事的职业是否与他们的价值观有关?是否有高相关性? 价值取向 职业 制造业 服务业 物质报酬 45 56 人情关系 35 44 练习3 某学校共60名学生参加英语培训班,培训前不及格而培训后及格者有20人,培训前及格而培训后不及格者有6人,问培训是否有显著效果? * * * * * * * * * * * * * * * * * * * * * * * * * 之所以要进行连续性校正,是因为由点计数据求得的χ2值是间断数列,当df=1,fe<5时,其间断性尤其明显。而χ2值表上的理论值是用连续量表表示的,其χ2分布是一条连续的光滑曲线。为了对连续的χ2曲线作较好的估计,将理论频数和观察频数的差的绝对值减去0.5,进行校正。可以通过增加样本来避免这个问题。 例3:历年优秀学生干部中男女比例为2:8,今年优秀学生干部中有3个男生,7个女生。问今年优秀学生干部的性别比例与往年是否有显著差异? 是否选用χ2检验 1.提出假设 H0:今年优秀学生干部的性别比例与往年没有显著差异 H1:今年优秀学生干部的性别比例与往年有显著差异 表15-5 学生干部性别比例的χ2检验计算表 男 3 2 1 0.5 0.25 0.125 女 7 8 -1 0.5 0.25 0.031 2.计算统计量 计算结果为: χ2= 0.156 当 df =1 时 χ2= 0.156 < 3.84,则 P 0.05 5.得出结论: 优秀学生干部中的性别比例与往年一样。 df = C -1 =1 4.找出临界值并比较--查χ2分布表 3.确定自由度 独立性χ2检验 若将每个样本个体归入两个不同的变量,我们可以检验两个变量之间是否存在关系。 e.g.将40名学生按照性格(内向/外向)和抑郁程度(高/低)归类,看性格特点是否和抑郁程度有相关。 性格与抑郁水平的2×2列联表 外向 内向 高抑郁 3 23 低抑郁 4 10 (Test of Independence) 独立性χ2检验 独立性χ2检验步骤 1.提出假设 H0 和 H1 2.运用公式进行统计量( χ2值)计算 3.确定自由度 4.找出临界值并与计算值比较大小 5.得出结论 步骤1.提出假设 H0 :两个变量之间没有相关 性格和抑郁程度之间没有相关 内向人群中抑郁高低程度的分布和外向人群中抑郁高低程度的分布式相同的。 H1:两个变量之间存在相关性 性格和抑郁程度之间存在相关 内向人群中抑郁高低程度的分布和外向人群中抑郁高低程度的分布式不相同。 步骤2.运用公式计算统计量 观察频数 理论频数 (15.1) 双向表的χ2值除用理论频数方法计算外,还可以用下式由实际频数直接求得: 公式中,foi 表示双向表中每格的实际频数 (15.4) 独立性χ2检验 理论频数的计算 (15.3) 公式中,fxi表示横行各组实际频数的总和 fyi表示纵列各组实际频数的总和 N表示样本容量的总和 外向 内向 总合 高抑郁 3 (?e) 23 (?e) 26 低抑郁 4 (?e) 10 (?e) 14 总合 7 33 40 步骤3.确定自由度 与样本大小(n)无关 df=(c-1 )(r-1)(c 和r表示两个变量各自组的个数) 步骤4.找出临界值并与计算的统计量进行比较 查表得出 步骤5.得出结论 拒绝H0 接受H1 例1:家庭经济状况属于上、中、下的高三毕业生,对于是否愿意报考师范大学有三种不同的态度(愿意、不愿意、未定),其人数分布如表16-1。问学生是否愿意报考师范大学与家庭经济状况是否有关系? 表16-1 不同家庭经济状况学生报考师

文档评论(0)

158****9376 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档