如何进行相关性分析.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
习题 统计学习题\test9相关与回归.htm 一、回归分析概述 二、一元线性回归模型 三、回归估计标准差 ★ ★ §6.2 一元线性回归分析 一元线性回归模型 对于经判断具有线性关系的两个变量y与x,构造一元线性回归模型为: 假定E(?)=0,总体一元线性回归方程: 一元线性回归方程的几何意义 截距 斜率 一元线性回归方程的可能形态 ?为正 ?为负 ?为0 总体一元线性 回归方程: 样本一元线性回归方程: 以样本统计量估计总体参数 斜率(回归系数) 截距 截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。 (估计的回归方程) (一元线性回归方程) 随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响 X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。 一元线性回归方程 中参数a、b的确定: 最小平方法 基本数学要求: 整理得到由两个关于a、b的二元一次方程组成的方程组: 进一步整理,有: 【分析】因为工业总产值与能源消耗量之间存在高度正相关关系( ),所以可以拟合工业总产值对能源消耗量的线性回归方程。 【例】建立工业总产值对能源消耗量的线性回归方程 资料 解:设线性回归方程为 即线性回归方程为: 计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。 回归系数b与相关系数r的关系: r>0 r<0 r=0 b>0 b<0 b=0 一、回归分析概述 二、一元线性回归模型 三、回归方程的拟合优度与评价 ★ ★ §6.2 一元线性回归分析 ★ 离差平方和的分解 每个因变量y的实际值与其平均数之间存在的总离差(y- )的平方和称为总离差平方和,简称总变差。 总变差 回归变差 估计值 与平均数 离差的平方和,称为回归变差(可解释变差)。 剩余变差 每个观察值y与估计值 的离差平方和,称为剩余变差(未解释变差。 剩余平方和 回归 平方和 总离差平方和 Lyy=U+Q 总离差平方和 回归平方和 剩余(误差)平方和 判定系数 是指因变量的总变差中可以被自变量解释部分的比例,即可解释因素的影响程度。用来说明因变量的变化有多少可通过自变量得到解释。是衡量拟合模型优劣的重要分析指标。 r2值越大,说明回归模型拟合得愈优。 * * * * * * * * * * 第六章 相关分析与回归分析 §6.1 相关分析概述 §6.2 一元线性回归分析 ★ 学习目的与要求:通过本章的学习使学生明确相关与回归的概念、种类,相关与回归分析的作用,掌握直线相关与回归分析的计算方法与原理。 学习重点与难点:本章重点是直线相关与直线回归的计算,难点是相关与回归在计算上的联系。 一、相关分析的意义 二、相关关系的测定 §6.1 相关分析概述 ★ ⒈ 出租汽车费用与行驶里程: 总费用=行驶里程 ? 每公里单价 ⒉ 家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。 函数关系 (确定性关系) 相关关系 (非确定性关) 比较下面两种现象间的依存关系 现象间的依存关系大致可以分成两种类型: 函数关系 指现象间所具有的严格的确定性的依存关系 相关关系 指客观现象间确实存在关系,但数量上不是严格对应的依存关系 函数关系与相关关系之间并无严格的界限:有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。 相关关系的概念 现象之间的相互联系,常表现为一定的因果关系,将这些现象数量化则成为变量:其中一个或若干个起着影响作用的变量称为自变量,通常用X表示,它是引起另一现象变化的原因,是可以控制、给定的值;而受自变量影响的变量称为因变量,通常用Y表示,它是自变量变化的结果,是不确定的值。 相关关系的概念 如果研究工业生产规模对工业贷款额的需求量问题,工业产值是自变量,工业贷款就是因变量; 如果研究贷款量对工业生产规模的影响情况,工业贷款额是自变量,工业产值是因变量。 研究居民收入水平与储蓄存款余额的关系 居民收入水平是自变量,储蓄存款余额是因变量。 有时相关关系表现的因果关系不明显,要根据研究目的来确定。 工业产值与工业贷款额的关系 例如 ⒈按涉及变量的多少分为 相关关系的种类 ⒉按照表现形式不同分为 ⒊按照变化方向不同分为 一元相关 多元相关 直线相关 曲线相关 负相关 正相关 相关关系的种类 相关分析的内容 对现象之间相互关系的方向和程度进行分析。 相关分析 主要内容

文档评论(0)

优美的文学 + 关注
实名认证
内容提供者

优美的文学优美的文学优美的文学优美的文学优美的文学

1亿VIP精品文档

相关文档