- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论与数理统计(相关分析)
第9章 相关分析与一元回归分析 9.1 相 关 分 析 9.2 回 归 分 析 第9章 相关分析与一元回归分析 变量之间的关系可以分为函数关系和相关关系两类,函数关系表示变量间确定的对应关系,而相关关系则是变量间的某种非确定的依赖关系. 相关分析主要是研究随机变量间相关关系的形式和程度,在相关关系的讨论中,两个变量的地位是同等的,所使用的测度工具是相关系数; 而回归分析则侧重考察变量之间的数量伴随关系,并通过一定的数学表达式将这种数量关系描述出来,用于解决预测和控制等实际问题. 本章主要学习相关分析和一元回归分析的有关概念、理论和方法. 第9章 相关分析与一元回归分析 【回归名称的来历】 “回归”这一词最早出现在1885年,英国生物学家兼统计学家—弗朗西斯?高尔顿(Francis Galton)在研究遗传现象时引进了这一名词.他研究分析了孩子和父母身高关系后发现: 虽然高个子的父母会有高个子的后代,但后代的增高并不与父母的增高等量. 他称这一现象为“向平常高度的回归”. 第9章 相关分析与一元回归分析 【回归名称的来历】 虽然高个子的父母会有高个子的后代,但后代的增高并不与父母的增高等量. 他称这一现象为“向平常高度的回归”. 尔后,他的朋友麦尔逊等人搜集了上千个家庭成员的身高数据,分析出儿子的平均身高 和父亲的身高x大致为如下关系: (英寸) 【回归名称的来历】 这表明: (1) 父亲身高增加1英寸,其儿子的身高平均增加0.516英寸. (2) 高个子父辈有生高个子儿子的趋势,但儿子的平均身高要比于父辈低一些. 如x=80,那么 低于父辈的平均身高. (3) 低个子父辈的儿子们虽为低个子,但其平均身高要比于父辈高一些.如x = 60 ,那么 ,高于父辈的平均身高. 【回归名称的来历】 可见儿子的高度趋向于“回归”到平均值而不是更极端,这就是“回归”一词的最初含义. 诚然,如今对回归这一概念的理解并不是高尔顿的原意,但这一名词却一直沿用下来,成为数理统计中最常用的概念之一. 回归分析的思想早已渗透到数理统计学科的其他分支,随着计算机的发展和各种统计软件的出现,回归分析的应用越来越广泛. 9.1 相 关 分 析 这种大量存在于随机变量间既互相联系,但又不是完全确定的关系,称为相关关系. 从数量的角度去研究这种关系,是数理统计的一个任务. 这包括通过观察试验数据去判断随机变量之间有无关系,对其关系大小作出数量上的估计,我们把这种统计分析方法称为相关分析. 相关分析通常包括考察随机变量观测数据的散点图、计算样本相关系数以及对总体相关系数的显著性检验等内容. 9.1.1 散点图 散点图是描述变量之间关系的一种直观方法. 用坐标的横轴代表自变量X,纵轴代表因变量Y,每组观测数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系, 从中可以直观地看出变量之间的关系形态及关系强度.图9.1是不同形态的散点图. (a) (b) (c) (d) (a) (b) (c) (d) 从散点图可以看出,变量间相关关系的表现形态大体上可分为线性相关、非线性相关、不相关等几种. 9.1.1 散点图 (a) (b) (c) (d) 就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关, 如图9.1(a)和(b); 如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关, 如图9.1(c); 如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系
文档评论(0)