- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.2_独立性检验的基本思想及其初步应用_学案(人教A版选修1-2)
1.2 独立性检验的基本思想及其初步应用
【课标要求】
1.了解独立性检验的基本思想、方法及其简单应用;
2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.
【核心扫描】
1.能够根据题目所给数据列出列联表及求K2.(重点)
2.独立性检验的基本思想和方法.(难点)
自学导引
1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的频数表,称为列联表.
②2×2列联表
一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为
y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d想一想:如何理解分类变量?
提示 (1)这里的“变量”和“值”都应作为“广义”的变量和值来理解.例如:对于性别变量,其取值有“男”和“女”两种,这里的“变量”指的是“性别”,这里的“值”指的是“男”或“女”.因此,这里说的“变量”和“值”不一定是取具体的数值.
(2)分类变量是大量存在的.例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.
2.独立性检验
定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),
其中n=a+b+c+d具体
步骤①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界α.然后查表确定临界值k0②利用公式计算随机变量K2的观测值k③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”3.独立性检验临界值表
P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828想一想:在K2运算时,在判断变量相关时,若K2的观测值k=56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正确的?
提示 两种说法均正确.
P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下,认为两变量相关;
而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过0.001的前提下,认为两变量相关.
名师点睛
1.在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.
2.独立性检验的基本思想
(1)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k2≥6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.
(2)在实际问题中要记住以下几个常用值:
①k>6.635有99%的把握认为“X与Y有关系”;
②k>3.841有95%的把握认为“X与Y有关系”;
③k>2.706有90%的把握认为“X与Y有关系”;
④k≤2.706就认为没有充分证据显示“X与Y有关系”.
(3)反证法原理与独立性检验原理的比较
反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0不成立.
独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.
3.两个分类变量相关性检验方法
利用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y”有关系,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
题型一 有关“相关的检验”
【例1】 某校对学生课外活动进行调查,结果整理成下表:
试用你所学
您可能关注的文档
最近下载
- 电子数据取证技术PPT课件(共12章)第3章取证技术基础.pptx VIP
- 电子数据取证技术PPT课件(共12章)第2章电子数据取证规范.pptx VIP
- 北师大版三年级数学上册 (长方形周长)周长课件教学.pptx
- 23G518-1门式刚架轻型房屋钢结构(无吊车).docx
- 电子数据取证技术PPT课件(共12章)第5章UNIXLinux操作系统取证技术.pptx VIP
- 砥砺身心成就未来主题班会.pptx VIP
- 2024年《公文写作与处理》考试题库大全(含答案).pdf VIP
- 电子数据取证技术PPT课件(共12章)第9章网络取证技术.pptx VIP
- 建设银行笔试试题.docx
- 电子数据取证技术PPT课件(共12章)第4章Windows操作系统取证技术.pptx VIP
文档评论(0)