- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(定性数据分析第五章课后答案
定性数据分析第五章课后作业
为了解男性和女性对两种类型的饮料的偏好有没有差异,分别在年青人和老年人中作调查。调查数据如下:
偏好饮料A 偏好饮料B 年青人 男性 37 26 女性 11 23 老年人 男性 30 43 女性 31 11 试分析这批数据,关于男性和女性对这两种类型的饮料的偏好有没有差异的问题,你有什么看法?为什么?
解:(1)数据压缩分析
首先将上表中不同年龄段的数据合并在一起压缩成二维2×2列联表1.1,合起来看,分析男性和女性对这两种类型的饮料的偏好有没有差异?
表1.1 “性别×偏好饮料”列联表
偏好饮料A 偏好饮料B 合计 偏好A比例 偏好B比例 男性 67 69 136 49.26% 50.74% 女性 42 34 76 55.26% 44.74% 二维2×2列联表独立检验的似然比检验统计量的值为0.7032,值为,不应拒绝原假设,即认为“偏好类型”与“性别”无关。
(2)数据分层分析
其次,按年龄段分层,得到如下三维2×2×2列联表1.2,分开来看,男性和女性对这两种类型的饮料的偏好有没有差异?
表1.2 三维2×2×2列联表
偏好饮料A 偏好饮料B 合计 偏好A比例 偏好B比例 年青人 男性 37 26 63 58.73% 41.27% 女性 11 23 34 32.35% 67.65% 老年人 男性 30 43 73 41.10% 58.90% 女性 31 11 42 73.81% 26.19% 在上述数据中,分别对两个年龄段(即年青人和老年人)进行饮料偏好的调查,在“年青人”年龄段,男性中偏好饮料A 占58.73%,偏好饮料B占41.27%;女性中偏好饮料A 占58.73%,偏好饮料B占41.27%,我们可以得出在这个年龄段,男性和女性对这两种类型的饮料的偏好有一定的差异。同理,在“老年人”年龄段,也有一定的差异。
(3)条件独立性检验
为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。
即由题意,可令表示年龄段,表示年青人,表示老年人;表示性别,表示男性,表示女性;表示偏好饮料的类型,表示偏好饮料,表示偏好饮料。欲检验的原假设为:给定后和条件独立。
按年龄段分层后得到的两个四格表,以及它们的似然比检验统计量的值如下:
层
合计 37 26 63 11 23 34 合计 48 49 97
层
合计 30 43 73 31 11 42 合计 61 54 115
条件独立性检验问题的似然比检验统计量是这两个似然比检验统计量的和,其值为
由于,所以条件独立性检验的似然比检验统计量的渐近分布的自由度为,也就是上面这2个四格表的渐近分布的自由度的和。由于值很小,所以认为条件独立性不成立,即在年龄段给定的条件下,男性和女性对两种类型的饮料的偏好是有差异的。
(4)产生偏差的原因
a、在(1)中,将不同年龄段的数据压缩在一起合起来后分析发现男性和女性在对两种类型的饮料的偏好上是没有差异的。但将数据以不同的年龄段分层后并分别分析发现男性和女性在对两种类型的饮料的偏好上是有一定差异的。合起来看和分开来看的结果不同。
b、由此看来,年龄段在此次调查中属于混杂因素。由于不同年龄段的人对饮料的选择也会有差异,例如现在的年青人偏好喝一些像可口可乐,美年达等这样的碳酸饮料,而老年人则偏好喝一些红茶,绿茶等这样的非碳酸饮料,在调查中,“老年人”年龄段共有115人,所占比例大,从而使整个结果就倾向于老年人的观点,即使得混杂因素“年龄段”起到一定的干扰作用,从而导致整个调查结果产生了偏差。
某工厂有三个车间。车间主任分别为王、张和李。过去的一年里,该工厂产品的质量情况总结如下:
车间主任 产品类别 产品质量情况 产品总数 合格产品数 不合格产品数 王 内销 2368 131 2499 外销 123 81 204 张 内销 293 3 296 外销 1247 255 1502 李 内销 307 12 319 外销 359 75 434 王主任将内销和外销产品合并在一起,然后计算各个车间的不合格率。计算结果如下:
主任 产品质量情况 不合格率 合格产品数 不合格产品数 王 2491 212 7.84% 张 1540 258 14.35% 李 666 87 11.55% 王主任说,我负责的车间生产情况最好,其次是李主任负责的车间,最差的是张主任负责的车间。这样的比较是不是有偏比较?为什么?
解:不是,有偏比较是指将数据压缩后合起来看与分层后分开来看得出的结果不一致时所产生的偏差,而此题只是将数据
您可能关注的文档
- [第三章名句名篇的识记与默写.doc
- (安装调试安全注意事项1.doc
- (安规习题库新法版含答案.docx
- (安规测试.docx
- (安规考试1.doc
- (安规考试线路三带答案.doc
- (安规调考试卷线路1卷.doc
- (安调高级答案.doc
- [第三章圆1101.doc
- (安踏渠道策略分析.doc
- 专题02+时事热点(精讲课件)2025年中考地理二轮复习讲练测(安徽专用).pptx
- 专题10+经济建设 2025年中考道德与法治二轮复习讲练测(广东专用).pptx
- 专题02+西游记【名著概览】+-+2025年中考语文必读名著演练.pptx
- 专题七+认识国家(课件)-【省心备考】2025年中考地理一轮复习优质课件.pptx
- 第22课《礼记》二则——《大道之行也》(课件)-2024-2025学年八年级语文下册同步备课精品资源.pptx
- 跨学科实践15:制作“龙骨水车”(课件)-2024-2025学年八年级物理下学期项目化课程案例.pptx
- 第13课_辽宋夏金元时期的对外交流(课件)2024-2025学年七年级历史下册同步教学课件.pptx
- 选择题专项讲解——综合类(课件)2025年初中道德与法治中考选择题练习.pptx
- 第21课《庄子》二则——《北冥有鱼》(课件)-2024-2025学年八年级语文下册同步备课精品资源.pptx
- 7.3+感受澳大利亚(第二课时)-2025学年七年级地理下册同步精品课堂(晋教版2024).pptx
文档评论(0)