- 1、本文档共126页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章相关分析与一元回归分析-郑州轻工业学院
郑州轻工业学院数学与信息科学系 第九章:相关分析与一元回归分析 概率统计教研组 第九章 相关分析与一元回归分析 变量之间的关系可以分为函数关系和相关关系两类,函数关系表示变量间确定的对应关系,而相关关系则是变量间的某种非确定的依赖关系. 相关分析主要是研究随机变量间相关关系的形式和程度,在相关关系的讨论中,两个变量的地位是同等的,所使用的测度工具是相关系数,而回归分析则侧重考察变量之间的数量伴随关系,并通过一定的数学表达式将这种数量关系描述出来,用于解决预测和控制等实际问题. 本章主要学习相关分析和一元回归分析的有关概念、理论和方法. 第九章 相关分析与一元回归分析 【回归名称的来历】 “回归”这一词最早出现在1885年,英国生物学家兼统计学家——弗朗西斯?高尔顿(Francis Galton)在研究遗传现象时引进了这一名词.他研究分析了孩子和父母身高关系后发现:虽然高个子的父母会有高个子的后代,但后代的增高并不与父母的增高等量.他称这一现象为“向平常高度的回归”. 尔后,他的朋友麦尔逊等人搜集了上千个家庭成员的身高数据,分析出儿子的平均身高和父亲的身高x大致为如下关系: (英寸) 第九章 相关分析与一元回归分析 【回归名称的来历】 这表明: (1) 父亲身高增加1英寸,儿子的身高平均增加0.516英寸. (2) 高个子父辈有生高个子儿子的趋势,但儿子的平均身高要比于父辈低一些.如x=80,那么 低于父辈的平均身高. (3) 低个子父辈的儿子们虽为低个子,但其平均身高要比 父辈高一些.如x=80,那么 高于父辈的平均身高 第九章 相关分析与一元回归分析 【回归名称的来历】 可见儿子的高度趋向于“回归”到平均值而不是更极端,这就是“回归”一词的最初含义.诚然,如今对回归这一概念的理解并不是高尔顿的原意,但这一名词却一直沿用下来,成为数理统计中最常用的概念之一.回归分析的思想早已渗透到数理统计学科的其他分支,随着计算机的发展和各种统计软件的出现,回归分析的应用越来越广泛. 第九章 相关分析与一元回归分析 主要内容 §9.1 相关分析 §9.2 回归分析 §9.1 相 关 分 析 在大量的实际问题中,随机变量之间虽有某种关系,但这种关系很难找到一种精确的表示方法来描述. 例如,人的身高与体重之间有一定的关系,知道一个人的身高可以大致估计出他的体重,但并不能算出体重的精确值.其原因在于人有较大的个体差异,因而身高和体重的关系,是既密切但又不能完全确定的关系. 随机变量间类似的这种关系在大自然和社会中屡见不鲜. 例如,农作物产量与施肥量的关系,商业活动中销售量与广告投入的关系,人的年龄与血压的关系,每种股票的收益与整个市场收益的关系,家庭收入与支出的关系等等 §9.1 相 关 分 析 这种大量存在于随机变量间既互相联系,但又不是完全确定的关系,称为相关关系. 从数量的角度去研究这种关系,是数理统计的一个任务.这包括通过观察和试验数据去判断随机变量之间有无关系,对其关系大小作出数量上的估计,我们把这种统计分析方法称为相关分析. 相关分析通常包括考察随机变量观测数据的散点图、计算样本相关系数以及对总体相关系数的显著性检验等内容. §9.1 相 关 分 析 9.1.1 散点图 散点图是描述变量之间关系的一种直观方法.我们用坐标的横轴代表自变量X,纵轴代表因变量Y,每组观测数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度. 图9-1 不同形态的散点图 §9.1 相 关 分 析 9.1.1 散点图 图9-1 不同形态的散点图 从散点图可以看出,变量间相关关系的表现形态大体上可分为线性相关、非线性相关、不相关等几种.就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图9-1(a)和(b); §9.1 相 关 分 析 9.1.1 散点图 图9-1 不同形态的散点图 如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关;如图9-1(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图9-1(d). §9.1 相 关 分 析 9.1.1 散点图 图9-1 不同形态的散点图 在线性相关中,若两个变量的变动方向相同,一个变量的数值增加,另一个变量的数值也随之增加,或一个变量的数值减少,另一个变量的数值也随之减少,则称为正相关,如图9
您可能关注的文档
- hcl标准溶液的浓度标定和混合碱的分析-韶关学院.ppt
- horizontalsubsystem(水平區子系統).ppt
- hplc-elsd法测定枸杞子中甜菜碱的含量-中国实验方剂学杂志.doc
- hplchighperformanceliquidchromatography高效能液相層析法.ppt
- hplc法分离测定孟鲁司特钠中s异构体-中国药品标准杂志.doc
- hyperspersemdc220.doc
- i.small-scalepurification.doc
- i-deas電腦輔助分析講義.ppt
- itu-rbt.1845建议书-为各种图像质量水平和尺寸的广播应用.doc
- i型胶原蛋冻干粉产品说明书1.doc-天津卫凯生物工程有限公司.doc
文档评论(0)