- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估计、推断 简单随机抽样 分层抽样 系统抽样 用样本估计总体 变量间的相关关系 用样本的频率分布估计总体分布 用样本数字特征估计总体数字特征 线性回归分析 * 1、两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 问题1:现实生活中两个变量间的关系有哪些呢? 相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。 * 思考:相关关系与函数关系有怎样的不同? 函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况 * 问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢? 2、最小二乘法估计 最小二乘法估计下的线性回归方程: * * * * * * * * * 如何描述两个变量之间线性相关关系的强弱? 在《数学3》中,我们学习了用相关系数r来衡量两个变量 之间线性相关关系的方法。 相关系数r * 相关关系的测度(相关系数取值及其意义) -1.0 +1.0 0 -0.5 +0.5 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 * 对回归模型进行统计检验 * 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。 54.5 54.5 54.5 54.5 54.5 54.5 54.5 54.5 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 * 思考P5: 预报变量(体重)的变化在多大程度上与解释变量(身高) 有关?在多大程度上与随机误差有关? 在散点图中,所有的点应该落在同一条水平直线上,但是观测到的数据并非如此。这就意味着预报变量(体重)的值受解释变量(身高)或随机误差的影响。 54.5kg * 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 例如,编号为6的女大学生的体重并没有落在水平直线上, 她的体重为61kg。解释变量(身高)和随机误差共同把这 名学生的体重从54.5kg“推”到了61kg,相差6.5kg,所以 6.5kg是解释变量和随机误差的组合效应。 用这种方法可以对所有预报变量计算组合效应。 * 数学上,把每个效应(观测值减去总的平均值)的平方加 起来,即用 表示总的效应,称为总偏差平方和。 在例1中,总偏差平方和为354。 * 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于 解释变量(身高)?有多少来自于随机误差? * 在例1中,残差平方和约为128.361。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为残差。 例如,编号为6的女大学生,计算随机误差的效应(残差)为: 对每名女大学生计算这个差异,然后分别将所得的值平方后加起来, 用数学符号表示为: 称为残差平方和, 它代表了随机误差的效应。 * 由于解释变量和随机误差的总效应(总偏差平方和)为354, 而随机误差的效应为128.361,所以解释变量的效应为 解释变量和随机误差的总效应(总偏差平方和) =解释变量的效应(回归平方和)+随机误差的效应(残差平方和) 354-128.361=225.639 这个值称为回归平方和。 * 我们可以用相关指数R2来刻画回归的效果,其计算公式是 * 显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。 在线性回归模型中,R2表示解释变量对预报变量变化的贡献率。 R2越接近1,表示回归的效果越好(因为R2越接近1,表示 解释变量和预报变量的线性相关性越强)。 如果某组数据可能采取几种不同回归方程进行回归分析, 则可以通过比较R2的值来做出选择,即选取R2较大的模型 作为这组数据的模型。 总的来说: 相关指数R2是度量模
您可能关注的文档
- 安徽省滁州二中八年级地理下册 第七章 南方地区课件 (新版)新人教版.ppt
- 安徽省滁州二中八年级地理下册 第七章 第二节“鱼米之乡”--长江三角洲地区课件课件 (新版)新人教版.ppt
- 安徽省滁州二中八年级地理下册 6.2 东北三省课件 (新版)新人教版.ppt
- 安徽省滁州二中八年级地理下册 第九章 第二节 高原湿地三江源地区课件 (新版)新人教版.ppt
- 安徽省滁州二中八年级地理下册 第八章 第二节 塔里木盆地课件 (新版)新人教版.ppt
- 安徽省滁州二中八年级数学上册 平面上点的坐标教案 沪科版.doc
- 安徽省滁州二中八年级数学上册 平面上点的坐标(第2课时)教案1 沪科版.doc
- 安徽省滁州二中八年级数学上册 平面上点的坐标(第2课时)教案2 沪科版.doc
- 安徽省滁州二中八年级生物上册 15.1 生物多样性教案 苏教版.doc
- 安徽省滁州二中八年级数学上册 平面内点的坐标教案(2课时)教案 沪科版.doc
- 安徽省滁州二中高中数学 合情推理课件 新人教A版选修1-2.ppt
- 安徽省滁州二中高中数学 演绎推理课件 新人教A版选修1-2.ppt
- 安徽省滁州二中高中数学 正弦定理(2课时)课件 新人教版必修5.ppt
- 安徽省滁州二中高中数学 独立性检验的基本思想及其初步应用课件 新人教A版选修1-2.ppt
- 安徽省滁州二中高中数学 第一章 解三角形教案 新人教A版必修5.doc
- 安徽省滁州二中高中物理 4.1 划时代的发现教案 新人教版选修3-2.doc
- 安徽省滁州二中高中数学 解三角形之正弦定理、余弦定理的应用课课件 新人教版必修5.ppt
- 安徽省滁州二中高中物理 4.3 楞次定律教案 新人教版选修3-2.doc
- 安徽省滁州二中高中物理 4.2 探究电磁感应的产生条件教案 新人教版选修3-2.doc
- 安徽省滁州二中高中物理 4.3 楞次定律课件2 新人教版选修3-2.ppt
文档评论(0)