知识讲解 独立性检验的基本思想及其初步应用.docxVIP

知识讲解 独立性检验的基本思想及其初步应用.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

感谢您选择名昊教育,名昊内部教学资料助力您成绩突飞猛进!

感谢您选择名昊教育,名昊内部教学资料助力您成绩突飞猛进!

楊老师联系电话(微信)无

楊老师联系电话(微信)无

【学习目标】

独立性检验的基本思想及其初步应用编稿:赵雷审稿:李霞

了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用

通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.

【要点梳理】

要点一、分类变量

有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:

对分类变量的理解。

这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。

分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。

要点二、2×2列联表

列联表

用表格列出的分类变量的频数表,叫做列联表。

2×2列联表

对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:

事件A

事件B

a

事件B

b

合计

a+b

事件A

c

d

c+d

合计

a+c

b+d

a+b+c+d

这样的表格称为2×2列联表。要点三:卡方统计量公式

Y1Y2合计X1a

Y

1

Y

2

合计

X

1

a

b

a+b

X

2

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

统计中有一个有用的(读做“卡方”)统计量,它的表达式是:

n(ad?bc)2

K2? (n?a?b?c?d为样本容量)。

(a?b)(c?d)(a?c)(b?d)

要点四、独立性检验

独立性检验

通过2×2列联表,再通过卡方统计量公式计算K2的值,利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。

变量独立性的判断

通过对K2统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:

①如果K2≤3.841时,认为事件A与B是无关的。

②如果K2>3.841时,有95%的把握说事件A与事件B有关;

③如果K2>6.635时,有99%的把握说事件A与事件B有关;要点诠释:

独立性检验一般是指通过计算K2统计量的大小对两个事件是否有关进行判断;

独立性检验的基本思想类似于反证法。即在H:事件A与B无关的统计假设下,利用K2统计量

0

的大小来决定在多大程度上拒绝原来的统计假设H,即拒绝“事件A与B无关”,从而认为事件A与B有

0

关。独立性检验为假设检验的特例。

利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。3.独立性检验的基本步骤及简单应用

独立性检验的步骤:

要推断“A与B是否有关”,可按下面步骤进行:

提出统计假设H:事件A与B无关(相互独立);

0

抽取样本(样本容量不要太小,每个数据都要大于5);

列出2×2列联表;

根据2×2列联表,利用公式:K2

n(ad?bc)2

?(a?c)(b?d)(a?b)(c?d),计算出K2的值;

统计推断:当K2>3.841时,有95%的把握说事件A与B有关;当K2>6.635时,有99%的把握说事件A与B有关;当K2>10.828时,有99.9%的把握说事件A与B有关;

当K2≤3.841时,认为事件A与B是无关的.

要点诠释:

①使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.

②一定要弄清K2的表达式?2

? n(ad?bc)2

(a?c)(b?d)(a?b)(c?d)

中各个量的含义.

③独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2

应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理.根据随机变量K2的含义,由实际计算的K2>6.635,说明假设不合理的程度约为99%,即“两个分

类变量有关系”这一结论成立的可信程度约为99%.当K2≤3.841时,认为两个分类变量是无关

的.

【典型例题】

文档评论(0)

tianya189 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档