第4节 变量间的相关关系与统计案例.docx

第4节 变量间的相关关系与统计案例.docx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第4节变量间的相关关系与统计案例

考试要求1会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4了解回归分析的基本思想、方法及其简单应用

1相关关系与回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数

(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关

(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关

(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系

2线性回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法

(2)回归方程:两个具有线性相关关系的变量的一组数据:(1,y1),(2,y2),…,(n,yn),其回归方程为eq\(y,\s\up6(^))=eq\(b,\s\up6(^))+eq\(a,\s\up6(^)),则eq\(b,\s\up6(^))=

,eq\(a,\s\up6(^))=eq\(y,\s\up6(-))-eq\(b,\s\up6(^))eq\(,\s\up6(-))其中,eq\(b,\s\up6(^))是回归方程的斜率,eq\(a,\s\up6(^))是在y轴上的截距

回归直线一定过样本点的中心(eq\(,\s\up6(-)),eq\(y,\s\up6(-)))

3回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法

(2)样本点的中心对于一组具有线性相关关系的数据(1,y1)(2,y2),…,(n,yn),其中(eq\(,\s\up6(-)),eq\(y,\s\up6(-)))称为样本点的中心

(3)相关系数

当r0时,表明两个变量正相关;

当r0时,表明两个变量负相关

r的绝对值越接近于1,表明两个变量的线性相关性越强

r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于075时,认为两个变量有很强的线性相关性

(4)相关指数:R2=其中

是残差平方和,其值越小,则R2越大(接近1),模型的拟合效果越好

4独立性检验

(1)利用随机变量2判断“两个分类变量有关系”的方法称为独立性检验

(2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量和Y,它们的可能取值分别为{1,2}和{y1,y2},其样本频数列联表(2×2列联表)为

y1

y2

总计

1

a

b

a+b

2

d

+d

总计

a+

b+d

a+b++d

则随机变量2=eq\f(n(ad-b)2,(a+b)(a+)(b+d)(+d)),其中n=a+b++d为样本容量

1求解回归方程的关键是确定回归系数eq\(a,\s\up6(^)),eq\(b,\s\up6(^)),应充分利用回归直线过样本点的中心(eq\(,\s\up6(-)),eq\(y,\s\up6(-)))

2根据回归方程计算的eq\(y,\s\up6(^))值,仅是一个预报值,不是真实发生的值

3根据2的值可以判断两个分类变量有关的可信程度,若2越大,则两分类变量有关的把握越大

1思考辨析(在括号内打“√”或“×”)

(1)“名师出高徒”可以解释为教师的教水平与生的水平成正相关关系()

(2)通过回归直线方程eq\(y,\s\up6(^))=eq\(b,\s\up6(^))+eq\(a,\s\up6(^))可以估计预报变量的取值和变化趋势()

(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()

(4)事件,Y关系越密切,则由观测数据计算得到的2的观测值越大()

答案(1)√(2)√(3)√(4)√

2(易错题)(2022·兰州模拟)在一组样本数据(1,y1),(2,y2),…,(n,yn)(n≥2,n∈N*,1,2,…,n不全相等)的散点图中,若所有样本点(i,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)+1上,则这组样本数据的样本相关系数为()

A-1 B0 eq\f(1,2) D1

答案D

解析由题设知,所有样本点(i,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)+1上,可知这组样本数据完全正相关,故其相关系数为1,故选D

3两个变量y与的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()

A模型1的相关指数R2

文档评论(0)

钟爱书屋 + 关注
官方认证
服务提供商

为中小学学生教育成长提供学习参考资料,学习课堂帮助学生教师更好更方便的进行学习及授课,提高趣味性,鼓励孩子自主进行学习,资料齐全,内容丰富。

认证主体韵馨科技(深圳)有限公司
IP属地广东
统一社会信用代码/组织机构代码
91440300MA5G40JF61

1亿VIP精品文档

相关文档