- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.2 独立性检验的基本思想及其初步应用
一、本节学习目标:
通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用二、本节学习重点:
对独立性检验的基本思想的理解 .
三、本节学习难点:
独立性检验的基本思想的应用 .
四、本节知识详解:
知识点一:分类变量
对于性别变量, 其取值为男和女两种 . 这种变量的不同 “值” 表示个体所属的不同类别,像这样的变量称为分类变量 .
知识点二:列联表
为调查吸烟是否对患肺癌有影响,
某肿瘤研究所随机调查了
9965 人,得到如下结果 (单
位:人):
吸烟与患肺癌列联表
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2189
49
2148
总计
9874
91
9965
像上表这样列出的两个分类变量的频数表,称为列联表知识点三:独立性检验
.
这种利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有关系”的方法称
为两个分类变量的独立性检验 .
知识点四:判断结论成立的可能性的步骤
一般地,假设有两个分类变量 X 和
Y,它们的值域分别为{
x1, x2}和{
y1, y2},其样
本频数列联表(称为 2× 2 列联表)为:
2× 2 列联表
y1
y2
总计
x1
x
b
x+ b
x2
总计
c
x+ c
d
b+ d
c+ d
x+ b+c+ d
若要推断的论述为
H1:“ X 与 Y 有关系”,
可以按如下步骤判断结论 H1 成立的可能性:
1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是
这种判断无法精确地给出所得结论的可靠程度.
①在三维柱形图中,主对角线上两个柱形高度的乘积
xd 与副对角线上的两个柱形高度
的乘积 bc 相差越大, H1 成立的可能性就越大 .
②在二维条形图中,可以估计满足条件
=
1 的个体中具有
=
1 的个体所占的比例
X x
Y y
a
,也可以估计满足条件 X=x2 的个体中具有
Y= y1
的个体所占的比例
c
. 两个比例的
+
b
c
+
d
a
值相差越大, H1 成立的可能性就越大 .
2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种
判断的可靠程度.具体做法是:根据观测数据计算由 K2
n
(
-
) 2
给出的检验随机变量
K2 的值 k,其值越大,说明“
ad bc
(a+ b)( c+ d)( a+ c)( b+ d)
=
X
与 Y 有关系”成立的可能性越大
. 当得到的观测数据
x,b,c,d 都不小于 5
时,可以通过查
阅下表来确定断言“
X与 Y 有关系”的可信程度 .
P( K2≥ k) 0.50
0.40
0.25
0.15
0.10
0.18
0.185
0.010
0.018
0.001
k
0.455
0.718
1.323
2.182
2.718
3.841
5.184
6.635
7.879
10.828
说明:当观测数据 x, b,c, d 中有小于 5 时,需采用很复杂的精确的检验方法.
五、几个典型例题:
例 1
三维柱形图中柱的高度表示的是
( A)
.各分类变量的频数
.分类变量的百分比
A
B
C.分类变量的样本数
D.分类变量的具体值
例 2
分类变量 X和 Y 的列联表如下
y1
y2
总计
x1
x
b
x+ b
x2
c
d
c+ d
总计
x+ c
b+ d
x+ b+c+ d
则下列说法正确的是
( C)
.
-
bc
越小,说明
X
和
Y
关系越弱
X xd
B. xd- bc 越大,说明 X和 Y 关系越强
C.( xd- bc) 2 越大 ,说明 X 和 Y 关系越强
D.( xd- bc) 2 越接近于
0 ,说明 X和 Y 关系越强
例 3
研究人员选取 170 名青年男女大学生的样本,对他们进行一种心理测验,发现有
60 名女生对该心理测验中的最后一个题目的反应是:作肯定的
18 名,不定的 42
名;男生
110 名在相同的项目上作肯定的有
22 名,否定的有
88 名. 问:性别与态度之间是否存在某
种关系?分别用图形和独立性检验的方法判断 .
解:根据题目所给数据建立如下列联表
性别
肯定
否定
总计
男生
22
88
110
女生
18
42
60
总计
40
130
170
根据列联表中的数据得到
2
170×( 22× 42- 18× 88) 2
≈ 2.158 < 2.718
K =
110× 60× 40× 130
因此没有充分的证据显示“性别与态度有关”.
例 4 打鼾不仅影响别人休息,而且可能与患某种病症有关
. 下表是一次调查所得的数
据,试问
文档评论(0)