- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 统计案例
[课标研读]
[课标要求]
了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.了解独立性检验(只要求2×2列联表)的基本思想、方法及应用.了解检验的基本思想、方法及应用了解聚类分析的基本思想、方法及其应用. 了解回归的基本思想、方法及其应用.,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。
第一讲 回归分析的基本思想及其初步应用
[知识梳理]
[知识盘点]
1.相关关系是一种非确定的关系, 是对具有相关关系的两个变量进行统计分析的一种方法。
2.线性回是模型(为 ),因变量的值是自变量和随机误差共同确定的,即自变量只能解释部分的变化,在统计中,我们把自变量称为 ,因变量称为 。
3.模型中的参数和用 估计,其计算公式如下:
,,其中,
称为 ,回归直线一定经过样本中心点。
4.用 来描述线性相关关系的强弱。当时,表明两个变量 ;
当,表示两个变量 ;的绝对值越接近于1,表明两个变量的线性相关性越 ;的绝对值越接近于0,表明两个变量的线性相关性越 。通常而言,当大于 时,认为两个变量具有很强的线性相关关系。
5.我们也可以用相关指数来刻划回归效果,其计算公式为:,
的值越大,说明残差平方和越小,也就是说模型的拟合效果越 。在线性回归模型中,表示解释变量对预报变量的 ,越接近于1,说明回归效果越好。
[特别提醒]
1.对于相关关系的理解应注意:相关关系与函数关系不同,函数关系是一种确定的关系,而相关关系是一种非确定的关系,它包括了两种情况:(1)两个变量中,一个为可控制变量,另一个为随机变量,例如化肥的施肥量与农作物的产量之间的关系就是相关关系,其中施肥量是可控变量,而农作物的产量是随机变量;(2)两个变量均为随机变量。而函数关系可以看成两个随机变量之间的关系,是一种确定性的关系。不能把相关关系等同于函数关系。对于相关性性检验中相关系数的取值范围及其对相关关系的影响需熟记。
2.本章内容为新课程标准中新添加的知识点. 回归分析的侧重点应先求回归直线方程,并进行相应的估计预测,但这类的题数据的处理与计算量可能很大,学习中应谨慎把握. 对于独立新检验问题,应以K2的计算与临界值的比较来判断分类变量的相关与无关为主.
3.线性回归分析是统计中额定一个重要内容,随着新课标的实施和新课程高考改革的不断深入,这部分的内容也将回越来越受到重视. 非线性回归问题有时并不给出经验公式,这时候我们可以画出已时数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象比较,挑选一种跟这些点拟合最好成的函数,然后采取适当的置换,把问题化为线性回归问题,使其得到解决。
4.回归直线方程求解需要复杂的运算,随着新课程标准的继续实施和新课程高考改革的不断深入,考查同学们数据处理能力,特别是运用计算器等现代技术工具对进行数据处理的能力,将是改革的方向之一. 有关理论要求同学们理解,但公式也不需要死记硬背.
[基础闯关]
1.下列说法正确的是( )
A.任何两个变量都具有相关关系;
B.球的体积与该球的半径具有相关关系;
C.农作物的产量与施化肥量之间是一种确定性关系;
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系。
2.在画两个变量的散点图时,下面哪个叙述是正确的( )
(A)预报变量在x轴上,解释变量在y轴上 (B)解释变量在x轴上,预报变量在y轴上
(C)可以选择两个变量中任意一个变量在x轴上 (D)可以选择两个变量中任意一个变量在y轴上
3.由一组样本数据,得到回归直线方程,那么下面说法不正确的是( )
A.直线必经过;
B.直线至少经过中的一个点;
C.直线的斜率为;
D.直线的纵截距为
4.对四对变量和进行相关性检验,已知是观测值组数,且已知①;②;③;④(已知时,;时,;;时,)
则有95%的把握说变量与具有线性相关关系的是( )
A.①和② B.①和③ C.②和④ D.③和④
5.已知一个回归直线方程为,则当变量增加一个单位时,变量的变化情况是 。
6.同一资料,如果将作自变量,作为因变量,得到回归系数;若将作为变量,作为因变量,得到回归系数;则相关系数与的关系是 。
[典例精析]
例1.(2006年广东佛山)19世纪未,德国统计学家恩格尔根据统计资料,对消费结构变化得出一个规律:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出会下降。推而广之,一个国家越穷,每个国民的平
文档评论(0)