第八章成对数据的统计分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第八章成对数据的统计分析

8.1成对数据的统计相关性

一、变量的相关关系

1、相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;

2、散点图:将样本中n个数据点xi

3.正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关;

4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,

我们称这两个变量线性相关;

5.非线性相关与曲线相关:如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关;

二、相关关系与函数关系的异同

1、相同点:两者均是指两个变量之间的关系;

2、不同点:(1)函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系;相关关系是一种不确定的关系,如一块农田的水稻产量与施肥量之间的关系;

(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.

三、样本相关系数

1、样本相关系数:设由变量x和y获得的两组数据分别为xi和yi

变量x

X

X

x

x

x

x

x

变量y

y

y

y

Y

y

y

y

两组数据xi和yi的线性相关系数是度量两个变量x与

其计算公式为ri

其中,x1n

2、相关系数r的性质

(1)当r0

当r

当r0

(2)样本相关系数r的取值范围为1,

当r越接近1时,成对样本数据的线性相关程度越强;

当r越接近0时,成对样本数据的线性相关程度越弱.

注意:样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强

题型一相关关系与函数关系辨析

①都可以分析出两个变量的关系;

②都可以用一条直线近似地表示两者的关系;

③都可以作出散点图;

④都可以用确定的表达式表示两者的关系.

【变式1】下列说法正确的是?

【变式2】下列语句表示的事件中的因素不具有相关关系的是()

题型二散点图与正、负相关判断

【例2】有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千

【变式1】某商场五天内某种T恤衫的销售情况如下表:

第x天

1

2

3

4

5

销售量y(件)

19

39

59

79

104

则下列说法正确的是?

【变式2】对变量x、y由观测数据得散点图1,对变量y、z由观测数据得散点图

图1

图2

【变式3】在下列各散点图中,两个变量具有正相关关系的是?

题型三相关系数的理解与判断

【例3】对于样本相关系数,下列说法错误的是()

【变式1】在变量y与x的回归模型中,根据下面四个的相关系数r,判断拟合效果最好的是()

【变式3】对四组数据进行统计,依次获得如图所示的散点图.

相关系数为r

相关系数为r

相关系数为r

相关系数为r

关于其相关系数的大小比较,将0、r1、r

题型四相关系数的计算与应用

【例4】在一次试验中,测得x,y的四组值分别为1,2,2,

参考公式:r

【变式1】若已知i1nxix2是i1nyiy

【变式2】已知某个样本点中的变量x、y线性相关,相关系数r0,则在以x

【变式3】假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:

x

2

3

4

5

6

y

2.2

3.8

5.5

6.5

7.0

已知i1

(1)求x,

(2)计算y与x的相关系数,并判断该设备的使用年限与所支出的维修费用的相关程度.

参考公式:r

8.2一元线性回归模型及其应用

一、一元线性回归模型

1、一元线性回归模型

在研究两个变量线性相关时,我们常利用成对样本数据建立统计模型,并利用模型进行预测.

Ybxae,Ee

其中,Y称为因变量或响应变量,x称为自变量或解释变量;

a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bxa之间的随机误差

如果e0,那么Y与x之间的关系就可用一元线性函数模型来描述

2、一元线性回归模型参数的最小二乘估计

回归直线方程过样本点的中心x,y

3.我们将ybxa称为Y关于

这种求经验回归方程的方法叫做最小二乘法,求得的b,a叫做b,

b

二、回归分析

1、残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测称为残差;

2、残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号或身高数据,或体重的估计值等,这样作出的图形称为残差图;

3.残差图法:残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽带越窄,说明模型拟合精度越高;

文档评论(0)

152****0127 + 关注
实名认证
文档贡献者

123

1亿VIP精品文档

相关文档