- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章回归分析第一节`回归分析意义
第7章 回归分析 第一节、回归分析意义 第二节、回归分析的种类 第三节、相关分析与回归分析的关系 第四节、一元线性回归分析 第五节、估计标准误差 “回归”名称产生的背景 回归分析的基本思想和方法以及“回归”名称的由来归功于英国统计学家F.Galton 、K.Pearson(皮尔森)等学者的工作。 他们在研究父母身高与其子女身高的关系时发现(样本量1078对夫妇),以每对夫妇的身高为x,子女的身高为y,将结果绘制成散点图,发现趋于一条直线, y=33.73+0.516x 表明父母平均身高每增加一个单位与其子女身高也平均增加0.516个单位. 结果表明虽然高个子父母生高个子儿子的趋势,但母辈增高1 个单位,儿子身高仅增加半个单位.平均来说一群高个子的父母的儿子低于他们父辈的平均高度.他们儿子身高没有比他们更高,高个子的父母的平均身高一部分被他们的子代拉了回来 ,即子代的平均高度向中心回归了. 低个了父母的儿子虽然为低个子,平均身高高于他们父辈, 低个子的父母的平均身高一部分被他们的子代拉了回来一些 ,子代的身高没有比他们父辈更低. 结果没有出现两极分化的现象,在一段相当长的时间内保持了生物学中物种的稳定,为了描述有趣的现象, F.Galton引用了”回归”的词 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 商品的消费量(y)与居民收入(x)之间的关系 商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系 第二节、回归分析的种类 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析; 如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。 如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 回归分析的类型 回归的类型? (函数关系) (1)是一一对应的确定关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条线上 变量间的关系 相关分析与回归分析内容比较 第三节、相关分析与回归分析的关系 (一)区别 1、相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。 2、相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。 3、相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。 4、相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。 (二)联系 1、相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。 2、回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。 (一)相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。 ( 二)相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。 第三节 一元线性回归分析 一、一元线性回归方程的建立 二、一元线性回归方程的分析 回答“变量之间是什么样的关系?” 方程中运用-主要用于预测和估计 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关
您可能关注的文档
最近下载
- 述责述廉报告 述责述廉报告2020三篇.docx VIP
- 沪教版小学四年级语文第一学期全册课件.ppt
- [贾平凹废都柳月]贾平凹作品废都.pdf
- 营房安全知识.docx VIP
- 东华大学教职工各类俱乐部(文体类)协会管理规定.doc
- 安徽省合肥市第四十五中学2023-2024学年八年级上学期期中物理试题(含答案).docx VIP
- 小学数学教研组教研工作总结PPT.pptx
- 贸易安全标准培训教材PPT课件(精编)共42页PPT-课件有实际AEO企业案例.pptx VIP
- 18.4数学活动-折纸做60°-30°-15°的角省公开课获奖课件市赛课比赛一等奖课件.pptx
- 2024软件正版化培训.pptx VIP
文档评论(0)