山东省平邑县曾子学校高中数学选修1-2学案第一章统计案例小结.doc

山东省平邑县曾子学校高中数学选修1-2学案第一章统计案例小结.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第一章统计案例

第一章统计案例小结

【学习目标】

1.了解变量的相关性.

2.会作散点图.

3.会求线性回归方程.

4.了解独立性检验(2×2列表)的基本思想、方法与应用.

5.了解回归分析的基本思想方法及其应用.

【新知自学】

新知梳理:

1.两个变量的相关关系

(1)如果两个变量之间确实存在关系,但又没有函数关系所具有的确定性,它们的关系带有随机性,则称这两个变量具有相关关系.

(2)有相关关系的两个变量,若一个变量的值由小到大时,另一个变量的值也是由小到大,这种相关称为;反之,一个变量的值由小到大,另一个变量的值由大到小,这种相关称为.

(3)如果散点图中,具有相关关系的两个变量所有观察值的数据点,分布在一条直线附近,则称这两个变量具有,这条直线叫做,方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),

其中eq\o(b,\s\up6(^))=,

eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).

(4)样本的相关系数

r=.

当r>0时,表示两个变量正相关,当r<0时,表示两个变量负相关,|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|0.75时,认为两个变量有很强的线性相关关系.

2.回归分析

(1)残差=yi-eq\o(y,\s\up6(^))i

(2)相关指数R2=.

用R2来刻画回归的效果,R2越大,说明残差平方和越小,表示.在线性回归模型中R2表示解释变量对预报变量变化的贡献率.R2越接近1,表示回归效果越好.

(3)建立回归模型的基本步骤

①确定研究对象,明确解释变量与预报变量;

②画出解释变量与预报变量的散点图;

③由经验确定回归方程的类型;

④估计回归方程中的参数;

⑤分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适等.

3.独立性检验

(1)分类变量

用变量的不同“值”,表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.

(2)列联表:即列出两个分类变量的频数表:一般地,假设有两个分类变量eq\o(x,\s\up6(-))和eq\o(y,\s\up6(-)),它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:

y1

y2

合计

x1

a

b

a+b

x2

c

d

c+d

合计

a+c

b+d

n

其中n=a+b+c+d为样本容量.

(3)可以利用独立性检验来考察两个分类变量是否有关系,并且能较为准确地给出这种判断的可靠程度,具体做法是:根据观测数据计算由公式K2=eq\f(n(ad-bc)2,(a+b)(a+c)(c+d)(b+d))所给出的检验随机变量的观测值k,并且k的值越大,说明“X与Y有关系”成立的可能性越大,同时可以利用以下数据来确定“X与Y有关系”的可信程度.

如果k>10.828,就有99.9%的把握认为“X与Y有关系”;

如果k>7.879,就有99.5%的把握认为“X与Y有关系”;

如果k>6.635,就有99%的把握认为“X与Y有关系”;

如果k>5.024,就有97.5%的把握认为“X与Y有关系”;

如果k>3.841,就有95%的把握认为“X与Y有关系”;

如果k>2.706,就有90%的把握认为“X与Y有关系”;

如果k≤2.706,就认为没有充分的证据显示“X与Y有关系”.

这种利用随机变量k2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.

对点练习:

1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()

A.r2r40r3r1B.r4r20r1r3

C.r4r20r3r1D.r2r40r1r3

2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()

A.-1B.0C.eq\f(1,2)D.1

3.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年

文档评论(0)

150****1851 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档