- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 相关与回归分析 相关分析 一元线性回归 多元线性回归 回归分析的其他问题 学习目标 掌握两个或多个变量之间相关关系的分析方法。 能够根据收集到的数据估计一元和多元回归方程,并对结果进行解释。 掌握回归分析模型的各类检验方法。 7.1 相关分析 函数关系与相关关系 相关分析与回归分析 散点图 相关系数 函数关系与相关关系 当一个变量取一定数值时,另一个变量有确定值与之相对应,这种关系称为函数关系。 当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化,这种关系称为相关关系。 对相关关系的分析是统计学的重要研究内容。 主要研究方法:相关分析和与回归分析。 相关分析与回归分析 相关分析(Correlation Analysis)研究变量之间相关的方向和相关的程度,但无法给出变量间相互关系的具体形式,因而无法从一个变量推测另一个变量。 相关分析的类型 根据相关关系的类型和程度可以有以下分类: 散点图 Scatter Diagram 散点图是观察两个变量之间的相关程度和类型最直观的方法。 散点图是在直角坐标系中用相对应的两个变量值作为图中一个点的横坐标和纵坐标描点得到的图形。 自变量和因变量 如果两个变量中一个变量是另一个变量变化的结果,那么 代表原因的变量称为自变量 [Independent (Explanatory) Variable], 代表结果的变量称为因变量 [Dependent (Response) Variable] 。 在散点图中习惯上把因变量绘制在纵轴上。 用散点图观察变量之间的相关关系 例题7.1 教材中的表7.1是 1985-2007年北京市城镇居民人均年消费性支出(变量Y)和人均年可支配收入(变量X)的有关资料,请对X和Y变量进行相关分析 。 散点图 相关系数的计算及其检验 相关系数的计算 相关系数r 的特征 当r>0时,X与Y为正相关;当r<0时,X与Y为负相关。 没有单位,取值介于-1与1之间。 绝对值越接近1说明关系越密切。r=1为完全正相关,而r=-1为完全负相关。 注意:当r=0时,只是表明两个变量之间不存在线性关系,它并不意味着X与Y之间不存在其他类型的相关关系。 相关系数的显著性检验 样本相关系数r受到抽样波动的影响,是一个随机变量。 相关系数非常高的样本也有可能来自无相关关系的总体。为了排除这种情况,需要对相关系数进行假设检验。 样本能代表总体吗? 如果红色的点碰巧为你的样本,则样本相关系数为0.907,总体相关系数为0.00005 相关系数的显著性检验 1、提出假设:H0:? ? ? ;H1: ? ? 0 消费支出和可支配收入的相关系数 计算结果: t检验值为 临界值t???(21)=2.08,故拒绝H0,认为相关系数显著。 注意:相关关系≠因果关系! 典型的错误推断: 统计分析表明,庆祝生日次数越多的人越长寿。因此,庆祝生日有利于健康。 调查表明,世界各国人均电视机拥有量与预期寿命存在很强的正相关性。因此,电视机拥有量越高,预期寿命越长。 对小学各年级学生的抽样调查表明,学生的识字水平与他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他的识字水平就越高。 7.2 一元线性回归分析 总体回归函数 、样本回归函数 一元线性回归模型的估计 一元线性回归模型的检验 趋向中间高度的回归 回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。 Regression 的原始释义 回归模型的类型 总体回归函数 样本回归函数 总体回归直线与样本回归直线 样本回归函数与总体回归函数区别 1、总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。 2、总体回归函数中的β1和β2是未知的参数,表现为常数。而样本回归函数中的 是随机变量,其具体数值随所抽取的样本观测值不同而变动。 样本回归函数与总体回归函数区别 3、总体回归函数中的et是Yt与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的et是Yt与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et的具体数值。 一元线性回归模型的统计假设 7.2.2 一元线性回归模型的估计 总体回归直线
您可能关注的文档
最近下载
- 2025-2026学年人教版英语八年级上册UNIT 8 单元综合评估卷(含答案及听力原文,无听力音频).doc VIP
- 常用电工仪器仪表使用方法PPT课件.pptx VIP
- 2025年广东省华医网公需课考题答案—人工智能赋能制造业高质量发展.docx VIP
- 基于核心素养的初中生物实验教学设计研究报告教学研究课题报告.docx
- 物流园安全生产三项制度(安全生产责任制、制度、操作规程)汇编.pdf VIP
- 2019年山东省广播电视技术能手竞赛(网络安全)答案.doc VIP
- (9月3日)铭记历史,吾辈自强——纪念抗日战争胜利80周年初中主题班会课件.pptx VIP
- 07 保护及故障信息管理子站技术规范书(通用).doc
- 2025-2026学年小学信息科技湘教版2024三年级上册-湘教版(2024)教学设计合集.docx
- 第一届全国技能大赛贵州选拔赛砌筑项目技术文件1.docx VIP
文档评论(0)