- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.2 独立性检验的基本思想及其初步应用
1.分类变量的定义.如果某种变量的不同“值”表示个体所属的不同类别像这样的变量称为分类变量.2.2×2列联表.一般地假设有两个分类变量X和Y它们的取值分别为{x和{y其样本频数列联表(称为2×2列联表)为:
总计 x+b+d总计 a+c b+d a+b+c+d 3.独立性检验.,
1.下列变量中不属于分类变量的是()
A.性别 .吸烟宗教信仰 .国籍解析:“吸烟”不是分类变量是否吸烟”才是分类变量.故选下面是一个2×2列联表 y1 y2 合计 x合计 b 46 100则表中a、b的值分别为(C)、96 B.52、50、54 D.54、52解析:由a+21=73得a=52由b+46=100得=3.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况具体数据如下表:为了判断主修统计专业是否与性别有关系根据表中的数据得到K≈4.844>所以判定主修统计专业与性别有关系那么这种判断出错的可能性为____________.解析:P(K>3.841)=0.05判断出错的可能性为5答案:5
通过案例理解分类变量、列联表、独立性检验的含义利用列联表的独立性检验进行估计.
独立性检验的基本思想随机变量K的含义.
(1)直观分析的两种方法.频率分析.通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系通常通过列联表列出两个分类变量进行分析.一般地假设有两个分类变量X和Y它们的取值分别为{x和{y其样本频数列联表(称为2×2列联表)为: y y总计 x+b+d总计 a+c b+d a+b+c+d在列联表中如果两个分类变量没有关系则应该满足ad-bc≈0.因此|ad-bc|越小说明两个分量之间的关系越弱;|ad-bc|越大说明两个分类变量之间的关系越强.图形分析.利用等高条形图来分析两分类变量之间是否具有相关关系形象、直观地反映两个分类变量之间的总体状态和差异大小进而推断它们之间是否有关系.绘制等高条形图时列联表的行对应的是高等高条形图中有两个高度相同的矩形每一个矩形中都有两种颜色观察下方颜色区域的高度如果两个高度相差比较明显就判断两个分类变量之间有关系.(2)独立性检验及其基本思想.独立性检验.利用随机变量K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用上诉公式求出K2的观测值为=再得出X与Y有关系的程度通常用到以下数据:(i)如果k>6.635在犯错误的概率不超过0.01的前提下认为X与Y有关系;(ii)如果k>2.706在犯错误的概率不超过0.1的前提下认为X与Y有关系;值得注意的是:观察值k越大越有利于结论“X和Y有关系”越小越有利于结论“X和Y没有关系”.因此可以建立一定的规则:当k≥k时就说X与Y有关系<k时就说XY没有关系故求得观测值后只要与建立的规则进行比较即可得出结论.独立性检验的基本思想.独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度首先假设该结论不成立即假设“两个分类变量没有关系”成立在该假设下我们构造的随机变量K应该很小如果由观察数据计算得到K的观测值k很大则在一定程度上说明假设不合理根据随机变量K的含义可以通过P(k≥6.635)≈0.01来评价假设不合理的程度由实际计算出k>6.635说明假设不合理的程度约为99即99%,不合理的程度可查下表得出:
1.独立性检验是对两个分类变量间是否有关系的一种案例分析方法其分析方法有:等高条形图法和K2的观测值来进行判断.在等高条形图中可以估计满足条件X=x的个体中具有Y=y的个体所占的比例为也可以估计满足条件X=x的个体中具有Y=y的个体所占的比例为两个比例的值相差越大两个分类变量相关的可能性就越大.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据公式K=计算K的观测值;(3)比较K与临界值的大小关系作统计推断.
1.在等高条形图形中下列哪两个比值相差越大两个分类变量有关系”成立的可能性越大()
A.与与与与通过随机询问110名性别不同的大学生是否爱好某项运动得到如下的列联表; 男 女 合计 爱好 40 20 60不爱好 20 30 50总计 60 50 110由K=算得=附表:P(F2≥k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 参照附表得到的正确结论是()
A.有99%以上的把握认为“爱好该项运动与性别有关”有99%以上的把握认为“C.在犯错误的概率不超过0.1%的前提下认为“爱好该项运动与性别有关”在犯错误的概率不超过0.1%的前提下认为“爱好该项运动与性别无关”某高校“统计初步”课程的
您可能关注的文档
最近下载
- 2024年党章党规党纪应知应会知识阶段测试题库附答案.docx VIP
- 提高对患者跌倒坠床防范措施落实率PDCA.pptx VIP
- 三矿--2025年安全生产治本攻坚三年行动任务分解及完成情况表(2.25)(1).xlsx VIP
- 新编英语教程8Unit-2.ppt VIP
- 鹤煤三矿三年行动月报表(2.25).xls VIP
- 鹤煤三矿治本攻坚三年行动中期评估表6.9(1).doc VIP
- 人教版七年级上册《What’s this in English》教学设计.docx VIP
- 道德与法治三年级上册第三单元 安全护我成长 大单元整体学历案教案 教学设计附作业设计(基于新课标教学评一致性).docx VIP
- 防撞护栏墩专项施工方案.docx VIP
- 精神病患者分析研判报告.docx VIP
文档评论(0)