第三章统计案例知识梳理高二数学理下学期期末专项复习人教A版选修2-3.docxVIP

第三章统计案例知识梳理高二数学理下学期期末专项复习人教A版选修2-3.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2020-2021学年高二理数学下学期期末专项复习(人教A版选修2-3)

知识梳理

第三章统计案例

知识点一回归分析的基本思想及其初步应用

1.线性回归模型

(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

(2)在回归模型中,y的值由x和随机因素e共同确定,即x只能解释部分y的变化,x称为解释变量,y称为预报变量,e称为随机误差,它的均值E(e)=0,方差D(e)=σ20.

2.线性回归分析

1)线性回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))__,则eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do6(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do6(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(\o(∑,\s\up6(n),\s\do6(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do6(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).其中,eq\o(b,\s\up6(^))是回归方程的斜率,eq\o(a,\s\up6(^))是在y轴上的截距.

回归直线一定过样本点的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).

2)回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))称为样本点的中心.

(3)相关系数

当r0时,表明两个变量正相关;

当r0时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强.

r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

4)残差图法

作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.

残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2,残差平方和越小,模型拟合效果越好.

5)相关指数:用R2刻画回归效果

在回归分析中,可以用R2=来刻画回归的效果,它表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.

知识点二独立性检验的基本思想及期初步应用

1.分类变量和列联表

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表

①定义:列出的两个分类变量的频数表,称为列联表.

②2×2列联表

一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.

y1

y2

总计

x1

a

b

a+b

x2

c

d

c+d

总计

a+c

b+d

a+b+c+d

2.等高条形图

(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.

(2)观察等高条形图发现eq\f(a,a+b)和eq\f(c,c+d)相差很大,就判断两个分类变量之间有关系.

3.独立性检验

(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.

(2)K2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d)),其中n=a+b+c+d为样本容量.

(3)独立性检验的具体做法

①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.

②利用公式计算随机变量K2的观测值k.

③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不

文档评论(0)

192****4596 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档