网站大量收购独家精品文档,联系QQ:2885784924

第八讲 相关分析和回归分析详解.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
王玉荣制作 UIBE DMD讲义 第七讲 数据的回归和相关分析 王玉荣制作 第八讲 相关与回归分析 线性回归 Linear Programming 一种强有力的基于数据的预测模型工具 建立反映一个变量的变化与其他相关变量变化的具体公式 问题的引出 案例1:研究考试成绩与复习时间的关系 你希望自己的应用统计考多少分? 需要花多少时间复习? 案例2:为了确定周末版报纸的日发行量 某大型报业公司想发行周末版,但在作出决定之前,必须确定周末版的日发行量,这个报纸当前在三个城市的日报日发行量分别为:200,000、400,000和600,000份,为了预测该报纸周末版的日发行量,该公司的市场部收集了本国35个报纸的日报日发行量与其周末版的日发行量的数据 案例3:分析影响信用卡支付倾向因素 CONSUMER RESEARCH 是一家专门从事社会调查和咨询服务的研究机构,能够为各个用户提供消费者态度和行为方面的资料。在该机构最近组织的有关消费者使用信用卡支付倾向的调查资料中,希望分析年收入、家庭成员和年信用卡支付金额的关系。 教学目的和要求 ■通过本讲学习,学生应该熟练掌握简单相关和回归分析方法的基本概念,基本步骤和应用,对多元相关和回归分析方法有一个初步的了解。 本讲内容 ★相关和回归分析的基本概念 ★两变量间线性关系的测度 ★简单线性回归分析 模型及其估计步骤 系数的检验 模型效果的评价 模型的应用 ★多元相关和回归分析 ★应注意的几个问题 相关和回归分析的基本概念 ?函数关系和相关关系 ?线性关系和非线性关系 ?相关分析的目的 ?回归分析的目的 函数关系和相关关系 ●函数关系: 两变量的数量表现在一定条件下是完全确定的。 ●相关关系(统计关系): 两变量的数量表现尽管存在着密切关系,但却不是完全确定的。 相关关系的种类 按涉及变量的多少可分 简单相关关系(一个自变量和一个因变量) 多元相关关系(多元相关关系:一个因变 量和多个自变量) 按两变量关系在图形上的形态可分 线性相关 非线性相关 按两变量变动的方向可分 正相关 负相关 分析相关关系的定量方法 相关分析和回归分析的目的 相关分析的目的 描述变量间相关分析的密切程度 回归分析的目的 在因变量和自变量之间建立一个数学模型,根据这个模型描述因变量如何随自变量的变化而变化。 是因果关系吗?请思考 相关分析(相关关系的测度) 散点图 协方差 相关系数 散 点 图 35家报纸的日报日发行量与其周末版的日发行量的散点图 协方差 定义(教材243页) 描述两变量间协变关系密切程度的一个量数 公式 作用 缺点 相关系数(教材248页) 定义 公式 取值范围 相关系数绝对值的含义 相关系数的显著性检验 回归(Regression)的由来 简单线性回归分析 简单线性回归模型及估计 简单线性回归模型及方程 简单线性回归方程参数的估计步骤 简单线性回归方程参数的估计方法 普通最小二乘法 简单线性回归模型(总体) 总体线性回归模型的图示 总体线性回归模型 样本线性回归方程 建立线性回归模型的步骤 确定研究的问题 定性和定量分析相结合,正确选择变量 搜取样本资料(数据资料) 设样本回归方程(如: ) 估计未知参数(计算统计量) 得到样本回归方程 检验回归方程 用模型预测因变量 拟合样本线性回归方程的方法(P250) ----最小二乘法 样本回归系数的计算公式 回归系数计算公式(教材251页) 首先计算两个数值: 再计算两个回归系数 Linear Regression Model To demonstrate this, we will examine the relationship between: hours of study for an exam the score on that exam The question is: is the number of hours of study a good predictor of the exam score? Linear Regression Model The scores for 20 randomly selected students are: Scatterplot Scatterplot 案例2: 散点图 判断回归模型拟合优良的指标 可决系数 总变差,已解释变差,未解释变差的关系 可决系数 定义:已解释变差与总变差的比值,在估计Yi时,在总变差中可被X解释的比率,它越大,说名Y与X的关系越密切,回归模型效果好 公式: 案例1的

文档评论(0)

挑战不可能 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档