- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
成才之路数学选修2—3、3-2.ppt
3.2 独立性检验的基本思想及其初步应用 1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用 2.通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力. 本节重点、难点:独立性检验的思想方法与初步应用. 1.两分类变量之间关联关系的定性分析 (1)分类变量:取不同的“值”表示个体所属不同类别的变量称为分类变量. 说明:①对分类变量的正确理解:这里的“变量”和“值”都应作为广义的变量和值进行理解.如:对于性别变量,其取值为男、女两种,所以这里的“变量”指的是“性别”,这里的“值”指的是“男”和“女”.故这里所说的“变量”和“值”不一定是具体的数值. ②分类变量是大量存在的,如吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别. (2)频率分析:通过对样本中每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联. (3)图形分析:利用三维柱形图及二维条形图来分析分类变量之间是否具有关联分析,图形的形象直观更能说明相关数据的总体状况. 一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频率列联表(即2×2列联表)如下表: 在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,说明X与Y有关的可能性越大,当ad与bc的差趋近于零时,X与Y几乎没有关系,可以说X与Y是相互独立的. 2.独立性检验 (1)定义:利用随机变量 K2= (其中n=a+b+c+d)来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下随机变量K2应该很小. 如果由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理.根据随机变量K2的含义,可以通过概率P(K2≥k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大. (2)如何用K2的值判断X与Y之间是否有关? 首先列2×2列联表,当得到的观测数据a,b,c,d都不小于5时,由2×2列联表求出K2的观测值k.若k≥10.828,则我们有99.9%的把握认为X与Y有关,这种判断结果出错的可能性约为0.1%;若k≥6.635,则我们有99%的把握认为X与Y有关,这种判断结果出错的可能性约为1%;若k≥2.706,则我们有90%的把握认为X与Y有关,这种判断结果出错的可能性约为10%;若k2.706,则没有充分的证据显示X与Y有关,但也不能认为X与Y无关. 3.独立性检验的基本方法 一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 若要推断的结论为:H1:“X与Y有关系”,可以按如下步骤判断结论H1成立的可能性: (1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大. ①如果k≥10.828,就有99.9%的把握认为“X与Y有关系”;②如果k≥7.879,就有99.5%的把握认为“X与Y有关系”;③如果k≥6.635,就有99%的把握认为“X与Y有关系”;④如果k≥5.024,就有97.5%的把握认为“X与Y有关系”;⑤如果k≥3.841,就有95%的把握认为“X与Y有关系”;⑥如果k≥2.706,就有90%的把握认为“X与Y有关系”;⑦如果k2.706,就认为没有充分的证据认为“X与Y有关系”. 1.分类变量:变量的不同“值”表示个体所属的不同类别,这类变量称为 . 2.在独立性检验中,常用 和 直观地反映相关数据的总体情况. 3.样本频数列联表:一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(即2×2列联表)为: K2= (其中n= 为样本容量). 4.利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的 . [例1] 某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示: 根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?(P(K2≥10.828)
您可能关注的文档
- 导购营销36计(三).doc
- 射阳实验初中2013年秋初三期中考试化学试卷.doc
- 射阳实验初中2013年秋初三期中考试语文期中试卷.doc
- 将图片文件中的文字提取到word文档的方法.doc
- 现场管理ABC59163.ppt
- 8.4有机合成材料复习课件(湘教版).ppt
- 8.4有机合成材料复习课件(湘教版)60471.ppt
- 现行事业单位资产的会计核算探讨.doc
- 珍珠棉应用.doc
- 珍藏版论文修改秘籍.doc
- 《GB/T 45311-2025潮流能转换装置 海上试验技术要求》.pdf
- GB/T 45311-2025潮流能转换装置 海上试验技术要求.pdf
- GB/T 17554.1-2025卡及身份识别安全设备 测试方法 第1部分:一般特性.pdf
- 中国国家标准 GB/T 17554.1-2025卡及身份识别安全设备 测试方法 第1部分:一般特性.pdf
- 《GB/T 17554.1-2025卡及身份识别安全设备 测试方法 第1部分:一般特性》.pdf
- 中国国家标准 GB/T 18655-2025车辆、船和内燃机 无线电骚扰特性 用于保护车载接收机的限值和测量方法.pdf
- 《GB/T 18655-2025车辆、船和内燃机 无线电骚扰特性 用于保护车载接收机的限值和测量方法》.pdf
- GB/T 18655-2025车辆、船和内燃机 无线电骚扰特性 用于保护车载接收机的限值和测量方法.pdf
- GB/Z 42749.7-2025信息技术 IT赋能服务业务过程外包(ITES-BPO)生存周期过程 第7部分:成熟度评估范例.pdf
- 《GB/Z 42749.7-2025信息技术 IT赋能服务业务过程外包(ITES-BPO)生存周期过程 第7部分:成熟度评估范例》.pdf
文档评论(0)