- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE
PAGE1/NUMPAGES16
第三节成对数据的统计分析
第1课时变量间的相关关系及回归模型
课程目标
课程目标
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.
2.结合实例,会通过相关系数比较多组成对数据的相关性.
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.
4.针对实际问题,会用一元线性回归模型进行预测.
基础知识
基础知识
1.变量的相关关系
(1)相关关系:若两个变量之间有关系,但又不是函数关系,这种关系称为相关关系;
(2)相关关系的分类:①从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;
②当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关;
提醒注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.(3)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,就称这两个变量线性相关.
2.样本相关系数
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),若x与y存在线性相关关系,可用样本相关系数r定量分析它们的相关程度的强弱.
(1)样本相关系数r=∑i
(2)样本相关系数r的性质
①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当r=0时,称成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线;
(2)经验回归方程为y=bx+a,其中b=∑i=1n
a=y-bx
(3)通过求Q=∑i=1n(yi-bxi-a)2的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小
4.判断回归模型的拟合效果
由成对样本数据(xi,yi)(i=1,2,…,n)按照最小二乘法得到经验回归方程y=bx+a,其中y叫做观测值,y叫做预测值,残差e=y-y.相对于样本点(xi,yi)的随机误差ei=yi-yi=yi-(bxi+a
(1)残差分析法
①作残差图:作图时纵坐标为残差,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图;
②残差分析:残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.
(2)决定系数(R2)法:R2=1-∑i=1n(yi-y
基础自测
基础自测
1.判断正误.(正确的画“√”,错误的画“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(√)
(2)散点图是判断两个变量相关关系的一种重要方法和手段.(√)
(3)经验回归直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.(×)
(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(√)
2.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()
A.①②③ B.②③①
C.②①③ D.①③②
解析:D第一个散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.
3.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是()
A.-0.82 B.0.78
C.-0.69 D.-0.87
解析:D由样本相关系数的绝对值越大,变量间的线性相关性越强知,各选项中r=-0.87的绝对值最大.
4.在对两个变量x,y进行回归分析时有下列步骤:①对所求出的经验回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求经验回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()
A.①②④③ B.③②④①
C.②③①④ D.②④③①
解析:D根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求经验回归方程,最后对所求的经验
您可能关注的文档
- 2024年广东省广州市中考物理试题.docx
- 2024年广东省中考历史真题.docx
- 2024年广东省中考生物真题(附答案解析).docx
- 2024年黑龙江省牡丹江市中考地理试题(附答案解析).docx
- 2024年黑龙江省牡丹江市中考生物真题(附答案解析).docx
- 2024年湖南省长沙市中考道德与法治真题.docx
- 2024年湖南省长沙市中考化学真题.docx
- 2024年湖南省长沙市中考物理试题.docx
- 2024年四川省广元市中考历史真题(附答案解析).docx
- 2024年浙江省“山海联盟”初中学业水平考试模拟卷(三)历史与社会试题(附答案解析) (1).docx
- 国际法复习题——空间法.pdf
- 2024年度初级会计《初级会计实务》真题汇编及答案.pdf
- 高考语用新题型专练:长句变短句+.pdf
- 2022年中级社会工作者专业技术考试《社会工作法规与政策》第五次习题(附答案).pdf
- 巧家县图书馆招聘考试真题.docx
- 湖南省株洲市炎陵县鹿原第一中学高三化学测试题含解析资料.docx
- 2023年计算机二级《Python语言程序设计》考试全真模拟易错、难点汇编叁(带答案)试卷号:23资料.docx
- 尔雅李肖明创业管理实战习题答案搜索版资料.docx
- 杭州第十四中学高中化学选修三第二章《烃》基础练习(含答案解析)资料.docx
- 2022年税务师考试《税法二》试题答案及解析资料.docx
文档评论(0)