统计学第十一篇.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章 相关与回归分析 变量间关系的度量 一元线性回归分析 第一节 变量间关系的度量 变量间的关系 相关关系的描述与测度 一、变量间的关系 在生产经营活动中,我们经常要对变量之间的关系进行分析。 比如,在企业生产中,我们要对影响生产成本的各种因素进行分析,以达到控制成本的目的;在农业生产中,我们需要研究农作物产量与施肥量的关系,以便分析施肥量对产量的影响,进而确定合理的施肥量;商业活动中,我们需要分析广告费支出与销售量之间的关系,进而通过广告费支出来预测销售量等。 变量之间的关系形态可分为两种类型:函数关系和相关关系。 一、变量间的关系 例1:某种产品的销售额和销售量之间的关系。设销售额为y,销售量为x,销售价格为p,则x与y之间的关系可表示为y=px。这就是说,在销售价格不变的情况下,对于该商品的某一销售量,总有一个销售额与之对应,即销售额完全由销售量所确定,二者之间为线性函数关系。 例2:企业的原材料消耗额(y)与产量(x1),单位产品消耗(x2),原材料价格(x3)之间的关系可表示为y=x1x2x3。这里的y与x1、x2、x3之间是一种确定的函数关系,但它们不是线性函数关系。 但实际问题中,变量之间的关系往往不那么简单。     例如:我们考察家庭储蓄与家庭收入这两个变量,它们之间不存在完全确定的关系。 例3:从遗传学角度看,子女的身高(y)与其父母的身高(x)有很大关系。     一般来说,父母身高较高时,其子女的身高通常也高,父母身高较低时,其子女的身高通常也较低。但实际情况并不完全如此,因为它们之间不是完全确定的关系。显然,子女的身高并不完全由父母身高一个因素所决定,还受其他许多因素的影响,因此二者之间属于相关关系。  相关与回归分析正是描述与探索这类变量之间关系及其规律的统计方法。 二、相关关系的描述与测度 (一)散点图 (二)相关系数 (一)散点图 相关分析就是对两个变量之间线性关系的描述与度量。对于两个变量x和y,通过观察或试验我们可以得到若干组数据,记为(xi,yi)(i=1,2,3…)。 相关分析所要解决的问题是,根据这些数据确定变量之间是否存在相关关系,如果存在的话,如何描述出它们之间的关系并对其关系强度进行测度。 定义2:用坐标的水平轴代表变量x,纵轴代表因变量y,每组数据( xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及散点形成的二维数据图称为散点图。 例:一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例提高,这给银行业务的发展带来压力。为弄清楚不良贷款形成的原因,研究人员希望利用银行业务的有关的有关数据作些定量分析,以便找出控制不良贷款的办法。下表是该银行所属25家分行2002年的有关业务数据。 由散点图可以看出:不良贷款与贷款余额、应收贷款、贷款项目个数、固定资产投资额之间都具有一定的线性关系,但从各散点的分布情况看,与贷款余额线性关系比较密切,而与固定资产投资额关系最不密切。 (二)相关系数 通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致描述,但散点图不能准确反映变量之间的关系密切程度。因此,为准确度量两个变量之间的关系密切程度,需要计算相关系数。 定义3:根据样本数据计算的对两个变量之间线性关系强度的度量值,称为相关系数。 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r。样本相关系数的计算公式为: 简化公式为: 例:根据表中数据,计算不良贷与贷款余额之间的相关系数。 可以证明:相关系数的取值范围在+1~-1之间,即-1≤r≤1。 若0<r≤1,x与y之间存在正线性相关关系; -1≤r<0,x与y之间存在负线性相关关系; r=+1,表明x与y之间为完全正线性相关关系;r=-1,表明x与y之间为完全负线性相关关系; r=0时,表示两个变量不存在线性相关关系。 |r|≥0.8时,可视为高度相关, 0.5≤|r|<0.8时,可视为中度相关; 0.3≤|r|<0.5时,视为低度相关; |r|<0.3时,说明两个变量之间的相关程度极弱,可视为不相关。 三、相关关系的显著性检验 一般情况下,总体相关系数ρ是未知的,通常是根据样本相关系数r作为ρ的近似估计值。由于r是根据样本数据计算出来的,它受到抽样波动的影响,由于抽取的样本不同,r取值不同,因此r是一个随机变量。 第二节 一元线性回归分析 相关分析 的目的在于测度变量之间的关系密切程度,它所使用的测度工具就是相关系数。 回归分析侧重于考察变量之间的数量伴随关系,并通过一定的数学表达式将这种关系描述出来,

文档评论(0)

187****5045 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档