相关分析方法 课件《统计学基础》同步教学(同济大学出版社).pptx

相关分析方法 课件《统计学基础》同步教学(同济大学出版社).pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

项目十

相关分析与回归分析

目录

CONTENTS

学习目标

·掌握相关关系的判断;

·了解相关关系的概念及种类;

·掌握回归系数的含义及计算;

·掌握一元线性回归分析方法;

·熟悉利用Excel进行相关分析和回归分析的方法。

项目导航

相关分析与回归分析

案例导入

2013年8月,谷歌公司(以下简称“谷歌”)把大数据技术成功地应用到电影票房的预测上,并撰文公布了研究成果QuantifyingMovieMagicwithGoogleSearch。该报告称,谷歌仅以单词搜索量为依据,构建了一个票房预测模型,可以提前一个月预测电影的首周票房,准确度高达94%。令人惊讶的是,这是一个简单的线性回归模型,谷歌是如何做到的呢?

据谷歌统计,2011—2012年,与电影相关的单词的搜索量飞速增长,这使得谷歌萌发了票房预测的想法。谷歌的工程师收集了2012年与电影相关的单词搜索总量与票房总收入的数据,并画出曲线图。随着时间的变化,两条曲线的起伏变化趋势十分相似,这预示着两条曲线存在很强的相关性,也就是搜索量和票房这两个变量之间存在强相关关系。起初,谷歌选取了2012年上映的99部电影,做出搜索量与票房的线性模型,预测准确率只有70%,而且只能提前一周预测一部电影的票房,这对电影的营销几乎没有帮助。经过反复试验,谷歌选用了电影预告片的搜索量、同系列电影前几部的票房和档期的淡季、旺季特征等作为参考指标,最终在2013年8月构建出准确率高达94%的预测模型,而这个

模型就是统计中最简单的线性回归模型。

谷歌票房的预测模型在2013年获得了成功,虽然这不能意味着该模型始终有效,但这让我们看到,随着大数据概念的兴起,数据预测这门新兴的技术在经济、体育、娱乐等领域越来越受青睐。在概率统计中的数据预测技术就是数据的相关分析和回归分析。

谷歌惊人的票房预测

02

模块二

相关分析方法

一、编制相关表

相关表是一种反映变量之间相关关系的统计表。将其中一个变量按照取值从小到大的顺序排列,再将与其相关的另一个变量对应的数值列出来,便可以形成简单相关表。通过相关表,可以初步看出相关关系的形式、密切程度和相关方向。

二、绘制相关图

相关图又称散点图,是把相关表中的原始数据在平面直角坐标系中以坐标点描绘出来,以横轴为自变量x,纵轴为因变量y,通过标出的每对变量值的坐标点或散布点(x,y),观察其分布情况。

三、计算相关系数

1.相关系数的意义

相关系数是在线性相关的条件下,用来说明两个变量间相关关系密切程度和方向的统计分析指标,通常用r表示。其表现形式为相对数,不受变量值计量单位的影响。

相关系数的取值有一个范围:-1≤r≤1;有两个方向:r0表示变量间正相关,r0表示负相关。|r|的大小可以反映变量间线性关系的强弱,也就是相关程度的评价标准,具体如下:

(1)0|r|≤0.3为弱相关。

(2)0.3|r|≤0.5为低度相关。

(3)0.5|r|≤0.8为显著相关。

(4)0.8|r|≤1为高度相关。

三、计算相关系数

2.相关系数的计算

1890年,英国统计学家卡尔·皮尔逊(KarlPearson)提出了相关关系的计算公式,即通过自变量和因变量的各自离差的乘积来计算,也称为差积法。相关关系的基本公式如下:

三、计算相关系数

2.相关系数的计算

在实际工作中利用相关系数的基本公式来计算相关系数非常烦琐。利用平均数的数学性质可以将其化简为

小案例

足长与阅读能力

通过记录和观察某小学所有低年级和高年级学生的足长以及语文阅读能力情况,发现足长的学生,其语文阅读能力往往比较强。足长与语文阅读能力正相关。这是否说明词汇量越多、阅读水平越高,学生的脚就越长呢?或者说,要想提高学生的阅读能力,可以想办法把他的脚变长吗?

事实上,足长与语文阅读能力是没有关系的,之所以从数据上看是正相关,是因为足长和阅读能力都与年龄有关。年龄大了,学的知识更多,阅读能力自然更好,而随着年龄的增加和身体的发育,足长自然也增加了。如果对同一年级的学生做统计,就会发现足长与阅读能力没有什么关系。年龄这个变量是混杂在足长与语文阅读能力这两个变量之间的,可称为混杂变量。正是它的存在,使计算相关系数以及画散点图都表明某两个变量相关,但是它们有可能并不是真正的相关。

知识拓展

高尔顿钉板与身高遗传

高尔顿的学生卡尔·皮尔逊也是著名的统计学家,他在研究家庭成员间的相似性时,测量了1078对父亲与其成年儿子的身高,并作了散点图,发现高个子父亲的成年儿子往往也比较高,矮个子父亲的成年儿子往往也比较矮。这说明父亲身高这个遗传因

文档评论(0)

蛋哥资料库 + 关注
实名认证
内容提供者

中小学教育,各类实用文档

1亿VIP精品文档

相关文档