- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 9 章 一元线性回归
9.1 变量间关系的度量
9.2 一元线性回归的估计和检验
9.3 利用回归方程进行预测
9.4 用残差检验模型的假定
回归分析研究什么?
假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,那么,就可以利用这一模型根据给定的自变量来预测因变量,这就是回归要解决的问题
在回归分析中,只涉及一个自变量时称为一元回归,涉及多个自变量时则称为多元回归。如果因变量与自变量之间是线性关系,则称为线性回归(linear regression);如果因变量与自变量之间是非线性关系则称为非线性回归(nonlinear regression)
4/10/2017
9.1 变量间的关系
9.1.1 变量间是什么样的关系?
9.1.2 用散点图描述相关关系
9.1.3 用相关系数度量关系强度
第 9 章 一元线性回归
怎样分析变量间的关系?
建立回归模型时,首先需要弄清楚变量之间的关系。分析变量之间的关系需要解决下面的问题
变量之间是否存在关系?
如果存在,它们之间是什么样的关系?
变量之间的关系强度如何?
样本所反映的变量之间的关系能否代表总体变量之间的关系?
4/10/2017
9.1.1 变量间是什么样的关系?
9.1 变量间的关系
函数关系
是一一对应的确定关系
设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
各观测点落在一条线上
4/10/2017
相关关系(几个例子)
子女的身高与其父母身高的关系
从遗传学角度看,父母身高较高时,其子女的身高一般也比较高。但实际情况并不完全是这样,因为子女的身高并不完全是由父母身高一个因素所决定的,还有其他许多因素的影响
一个人的收入水平同他受教育程度的关系
收入水平相同的人,他们受教育的程度也不可能不同,而受教育程度相同的人,他们的收入水平也往往不同。因为收入水平虽然与受教育程度有关系,但它并不是决定收入的惟一因素,还有职业、工作年限等诸多因素的影响
农作物的单位面积产量与降雨量之间的关系
在一定条件下,降雨量越多,单位面积产量就越高。但产量并不是由降雨量一个因素决定的,还有施肥量、温度、管理水平等其他许多因素的影响
4/10/2017
相关关系(correlation)
一个变量的取值不能由另一个变量唯一确定
当变量 x 取某个值时,变量 y 的取值对应着一个分布
各观测点分布在直线周围
4/10/2017
9.1.2 用散点图描述相关关系
9.1 变量间的关系
散点图(scatter diagram)
4/10/2017
用散点图描述变量间的关系(例题分析)
【例9-1】为研究销售收入与广告费用支出之间的关系,某医药管理部门随机抽取20家药品生产企业,得到它们的年销售收入和广告费用支出(万元)的数据如下。绘制散点图描述销售收入与广告费用之间的关系
4/10/2017
散点图(销售收入和广告费用的散点图)
4/10/2017
9.1.3 用相关系数度量关系强度
9.1 变量间的关系
相关系数(correlation coefficient)
度量变量之间线性关系强度的一个统计量
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为?
若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r
也称为Pearson相关系数 (Pearson’s correlation coefficient)
样本相关系数的计算公式
相关系数的性质
性质1:r 的取值范围是 [-1,1]
|r|=1,为完全相关
r =1,为完全正相关
r =-1,为完全负正相关
r = 0,不存在线性相关关系
-1?r0,为负相关
0r?1,为正相关
|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱
4/10/2017
相关系数的性质
性质2:r具有对称性。即x与y之间的相关系数和y与x之间
的相关系数相等,即rxy= ryx
性质3:r数值大小与x和y原点及尺度无关,即改变x和y的
数据原点及计量尺度,并不改变r数值大小
性质4:仅仅是x与y之间线性关系的一个度量,它不能用
于描述非线性关系。这意为着, r=0只表示两个
变量之间不存在线性相关关系,并不说明变量之
间没有任何关系
性质5:r虽然是两个变量之间线性关系的一个度量,却不
文档评论(0)