- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学,大学,相关与回归分析
第七章 回归与相关分析;统计应用; 用于衡量摄影材料感光度的测光计,可以提供胶片特性的信息,比如他的曝光时间范围。在宝丽来感光试验室中,科学家将一次成像胶片至于适当的温度和湿度下,使之近似于消费者购买后的保存条件,然后再将其系统的抽样检验并进行分析。为了研究宝丽来彩色专业打印胶片感光速度和保存时间的关系,宝丽来中心感光实验室抽取保存时间从1–13个月(生产之后的时间)不等的胶片。数据表明胶片感光速度随着时间增加而递减,胶片感光速度和胶片保存时间的关系可以近似用一条直线或线形关系表示出。
利用回归分析,宝丽来公司建立感光速度与保存时间之间的关系式
胶卷的感光速度的变动
x 胶卷的保存时间 ;第一节 相关与回归分析的基本概念;经济变量之间的关系,大体可分为两类:
确定性关系或函数关系:研究的是确定现象非随机变量间的关系。
统计依赖或相关关系:研究的是非确定现象随机变量间的关系。
;变量间的关系(函数关系);变量间的关系(相关关系);二、相关关系的种类;相关关系的图示; 相关分析:研究现象(变量)间相互依存关系的密切程度的方法论;
回归分析:通过数学模型,研究一现象(变量)对其他现象(变量)依赖关系的具体形态的方法论。
;在回归分析中,有两种变量:被预测变量称之被解释变量(Explained Variable)或因变量(Dependent Variable)后一些变量被称为解释变量(Explanatory Variable)或自变量(Independent Variable)。; 在上述收入-消费例中,经济理论认为居民消费支出是可支配收入的函数,即可支配收入(X)的变化是消费支出(Y)变化的原因,因此,可得如下回归模型:
Y = -0.208 + 0.718 X
从回归模型可知:居民每1元的可支配收入中,将有0.718元用于消费支出。
因此,如果估计其中一位居民可支配收入提高到100元,则可预测其消费支出将上升到71.556元。;注意;著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。
(线性)相关系数:当两变量间存在线性相关关系时,其相关的密切程度可用(线性)相关系数定义:
总体相关系数:
样本相关系数: ;一个10户居民的可支配收入 (百元)与消费(百元)的统计资料按升序排列入下表:
消费支出 15 20 30 40 42 53 60 65 70 78
可支配收入 18 25 45 60 62 75 88 92 99 98
其样本相关系数为:;
相关图
消费与可支配收入的相关图;第二节 一元线性回归;(一)总体回归模型与总体回归函数
回归分析同样是要考察现象总体的变化特征与规律,即变量总体间的具体依赖关系。它是通过总体回归模型来表示的:
式中,Yt和Xt是第t次观测值; 称为总体未知参数,也叫总体回归系数,ut称为随机误差项,或随机干扰项,代表了未列入模型中其他所有因素对Y的综合性影响。
;对总体回归模型来说,可以期望:;(二)样本回归函数与样本回归模型; 因此,Y的实际观测值与其期望值之差,就是随机误差项:
。
ut
; 如果 是 的良好的估计,就可用样本函数代替总体函数而研究Y与X间的关系及变化规律。
因此,回归分析的主要任务就是要采用适当的方法,充分利用样本信息,使估计的样本函数尽可能地接近于真实总体回归函数。
;(三)随机扰动项的标准假定; 回归模型的估计要求找到一种方法,使估计的样本回归函数能够尽可能地接近总体回归函数,从而作为总体回归函数的代表来描述变量间的具体相关关系。
方法有多种,最小二乘法(最小平方法)是其中最简单、适用性最广的一种估计方法。
;最小二乘法的基本思想:; 根据最小二乘法原理,需选择适当的系数 (i=1,2),以满足:
文档评论(0)