- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.2独立性检验的
基本思想及其初步应用(一);独立性检验; 吸烟与肺癌列联表;
列联表
①定义:列出的两个分类变量的 称为列联表.
②2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为 和 ,其样本频数列联表(也称为2×2列联表)为下表.;一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(即2×2列联表)为:
(其中n= 为样本容量).;不患肺癌;在三维柱形图中,主对角线上两个柱形高度的乘积与
副对角线上两个柱形高度的乘积相差越大,
两个分类变量有关系的可能性就越大.;不吸烟;某企业为了考察同一种产品在甲、乙两条生产线的产品合格率,同时各抽取100件产品,其中甲线中合格产品的个数为97,乙线中合格产品的个数为95。请做出列联表,三维柱形图与二维条形图。;;1.2×2列联表是传统的调查研究中最常用的方法之一,用于研究两个变量之间相互独立还是存在某种关联性,它适用于分析两个变量之间的关系.
2.在实际问题中,判断两个分类变量的关系的可靠性时,一般利用随机变量K2来确定,而不利用三维柱形图和二维条形图.; 上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。;因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;
|ad-bc|越大,说明吸烟与患肺癌之间关系越强。; 为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量-----卡方统计量;k大小的标准是什么呢?;独立性检验
首先,假设结论不成立,即
H :两个分类变量没有关系
(在这种假设下k应该很小)
其次,由观测数据计算K 的观测值k,
(如果k很大,则在一定可信程度上说明H 不成立,即两个分类变量之间有关系)
最后,根据k的值判断假设是否成立;这种判断可能有错误,但是犯错误的不会超过0.001,这是个小概率时间,我们有99.9%的把握认为“吸烟与患癌症有关系”;利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.;在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患肺病
B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病
C、若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误
D、以上三种说法都不对;例2 某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:
根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?(P(K2≥10.828)≈0.001);[解析] 假设H0:“对这一问题的看法与性别无关”,
由列联表中的数据,可以得到:
≈125.16110.828
又P(K2≥10.828)≈0.001,;故在犯错误概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关.;[点评] 可以利用独立性检验来判断两个分类变量是否有关系,具体做法是:;5月31日是“世界无烟日”,2009年的主题是“让肺自由呼吸”.为探究患肺癌是否与吸烟有关,某校研究性学习小组调查了1339名50岁以上的人,调查结果如下表所示:;[解析] 依题意可知:
6.635,
又P(K2≥6.635)=0.01,
因此,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关.;例3 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别?;[解析] 由上述列联表可知,在铅中毒病人中尿棕色素为阳性的占80.56%,而对照组仅占24.32%.说明他们之间有较大差别.;根据列联表作出三维柱形图(如图1),二维条形图(如图2),频率分布条形图(如图3所示),由上述三图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系.;某学校对学生课外活动内容进行调查,结果整理成下表:
利用图形判断学生课外活动的类别与性别是否有关系?;[解析] 某等高条形图如图所示.
由图可以直观地看出喜欢体育还是喜欢文娱在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系.;练习:
1.调查男女学生购买食品时是否看出厂日期与性别有
文档评论(0)