- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.2《独立性检验基本思想及其初步应用》
1.2 独立性检验的基本思想及其初步应用
eq \x(基)eq \x(础)eq \x(梳)eq \x(理)
1.分类变量的定义.
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
3.独立性检验.
,eq \x(基)eq \x(础)eq \x(自)eq \x(测)
1.下列变量中不属于分类变量的是(B)
A.性别 B.吸烟
C.宗教信仰 D.国籍
解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.
2.下面是一个2×2列联表
y1
y2
合计
x1
a
21
73
x2
2
25
27
合计
b
46
100
则表中a、b的值分别为(C)
A.94、96 B.52、50
C.52、54 D.54、52
解析:由a+21=73,得a=52,由b+46=100,得b=54.
3.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=eq \f(50×(13×20-10×7)2,23×27×20×30)≈4.844>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____________.
解析:P(K2>3.841)=0.05,判断出错的可能性为5%.
答案:5%
eq \a\vs4\al((一)重点)
通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计.
eq \a\vs4\al((二)难点)
独立性检验的基本思想,随机变量K2的含义.
eq \a\vs4\al((三)知识结构图)
eq \a\vs4\al((三)思维总结)
(1)直观分析的两种方法.
①频率分析.
通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常通过列联表列出两个分类变量进行分析.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y
x
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
在列联表中,如果两个分类变量没有关系,则应该满足ad-bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
②图形分析.
利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系.
a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显eq \b\lc\(\rc\)(\a\vs4\al\co1(即\f(a,a+b)和\f(c,c+d)相差很大)),就判断两个分类变量之间有关系.
(2)独立性检验及其基本思想.
①独立性检验.
利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
利用上诉公式求出K2的观测值为
k=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
再得出X与Y有关系的程度,通常用到以下数据:
(i)如果k>6.635,在犯错误的概率不超过0.01的前提下认为X与Y有关系;
(ii)如果k>2.706,在犯错误的概率不超过0.1的前提下认为X与Y有关系;
值得注意的是:观察值k越大,越有利于结论“X和Y有关系”,越小越有利于结论“X和Y没有关系”.因此,可以建立一定的规则:当k≥k0时就说X与Y有关系,k<k0时就说X和Y没有关系,故求得观测值后只要与建立的规则进行比较即可得出结论.
②独立性检验的基本思想.
独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观察数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%,不合理的程度可查下表得出:
1.
您可能关注的文档
- (2018最新)第十课新发展理念和中国特色社会主义新时代经济建设.pptx
- (人教版)二学年美术上册 花花衣.ppt
- (二学年)忆革命先烈,做优秀少年(党章、党规)进课堂主题队会ppt课件.ppt
- (2015年版)社会主义建设道路初步探索理论成果.pptx
- (上课用) 地形图判读.ppt
- (人教版)化学选修四:2.2《影响化学反应速率因素》ppt课件.ppt
- (人美版)一学年美术下册课件 下雨了 1.ppt
- (全国100所名校单元测验示范卷)2016高三生物一轮复习备考 第五单元 《分子与细胞》综合检测(教师用卷).doc
- (公路工程施工资格预审用)初步施工组织设计.doc
- (北京版)二学年语文上册课件 与房子有关的部首.ppt
最近下载
- 高中地理人教版必修 第二册第三章 产业区位因素第三节 服务业区位因素及其变化.pptx
- 医养中心营销策划方案.pdf VIP
- 2025年医疗服务行业人力资源报告:医护人员职业发展现状与趋势.docx
- 电气设备-独家解析-特斯拉4680电池结构与工艺设计-杭州车知知.docx
- 民族团结进步.pptx VIP
- 【OBE课程改革】《统计学》课程教学模式创新与实践.pdf VIP
- 武汉地区区域工程地质及水文地质概况、成井方法、基坑工程连通性抽水试验、降水水位计算与预测、回灌试验技术要求.pdf VIP
- 生产车间5s管理制度.docx VIP
- 【完整版】视频会议系统_本科毕业论文设计.docx VIP
- 国新基金组织架构.docx VIP
文档评论(0)