上海新教材高中数学:成对数据的统计分析.docVIP

上海新教材高中数学:成对数据的统计分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 1 高中数学 成对数据的统计分析 (一)成对数据的相关分析 1、成对数据间的关系 定义:在统计活动中,我们研究来自两个相关变量的两组数据之间的关系,我们把这两组数据叫做成对数据。研究成对数据相关性的方法称为相关分析 2、相关系数 一般地,在统计中用相关系数来衡量两个变量之间线性关系的大小。设由变量和获得的两组数据分别为和(),其对应关系如下: 两个变量的相关系数的计算公式为 其中,分别是这两组数据的平均数。 由上述计算公式得到的数值称为变量和变量的线性相关系数,简称相关系数 .越接近1,线性线关程度越高;越接近0,线性线关程度越低. (1)当时,的值由小变大时,的值有由小变大的趋势,这时称这种相关为正相关 (2)当时,的值由小变大时,的值有由大变小的趋势,这时称这种相关为负相关 两个变量的相关系数特点: (1)相关系数描述的是两个变量之间线性关系的方向与强度,是一种定量分析的方法. (2)相关系数的计算公式是关于对称的,画散点图时,不论以哪个变量作为横轴(纵轴),得到的 相关系数都一样. (3)两个变量的相关系数与这两个变量的单位无关. (4)与平均数和标准差一样,相关系数不仅会受到数据量多少影响,也会受到少数常数值的较大影响. (5)要用相关系数来描述两个随机变量的相关性,一般要求这两个变量满足正态分布. 【例1】如图,是对某位同学一学期次体育测试成绩(单位:分)进行统计得到的散点图,关于这位同学的成绩分析,下列结论错误的是(???????) A.该同学的体育测试成绩总的趋势是在逐步提高,且次测试成绩的极差超过分 B.该同学次测试成绩的众数是分 C.该同学次测试成绩的中位数是分 D.该同学次测试成绩与测试次数具有相关性,且呈正相关 【例2】根据下面四个散点图中点的分布状态,可以直观地判断两个变量之间具有线性相关关系的是______. ①. ②. ③. ④. 【例3】现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试数学成绩(y),数据如下表: 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 计算这10个学生的两次数学考试成绩的样本相关系数r,并判断两者是否具有线性相关关系. 【例4】互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲,乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表: 1日 2日 3日 4日 5日 外卖甲日接单(百单) 5 2 9 8 11 外卖乙日接单(百单) 2 3 10 5 15 (1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况; (2)据统计表明,与之间具有线性相关关系,请用相关系数对与之间的相关性强弱进行判断;(若,则可认为与有较强的线性相关关系,值精确到0.001) 参考数据:,. 1、如图,个数据,去掉后,下列说法错误的是(???????) A.与的相关性变强 B.相关指数变小 C.相关指数变大 D.解释变量与预报变量的相关性变强 2、下列关于相关系数的说法中,错误的是______. A.相关系数越大,两个变量间线性相关性越强 B.相关系数的取值范围是 C.相关系数时两个变量正相关,时两个变量负相关 D.相关系数时,样本点在同一直线上 3、某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,实验数据经整理得到如下的折线图: 由图可以看出,这种酶的活性指标值与温度具有较强的线性相关关系,请用相关系数加以说明. 附:,,,样本相关系数. (二)一元线性回归分析 3、一元线性回归分析 (1)由上节内容我们知道,一些散点在某条直线附近,那么这条直线方程是多少,回归分析的方法就是求这条直线方程。 设所求直线方程为:,当变量取值()时,是由方程得到的计算值,我们把称为在处的离差,当时称为正离差,时称为负离差。称为拟合误差,当拟合误差最小时,方程称为变量随波动的回归方程,对应的直线称为回归直线,称为解释变量,称为反应变量.依据成对数据求回归方程的统计方法称为回归分析,其中的模型参数和称为回归系数. 求回归和最基本的方法叫做最小二乘法.用最小二乘法求线性回归系数的公式如下: 由最小二乘法得到的回归方程为:.称为模型参数和的最小二乘估计. (2)建立一元线性回归模型的一般步骤如下: 1、确定研究对象,从一组数据出发,根据实际问题,明确哪个变量是自变量,哪个是因变量. 2、画出确定好的自变量和因变量的散点图,观察它们

文档评论(0)

数学小助理 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档