- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
请同学们观察这4幅图,看有什么特点? 1.如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系 2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系 3.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系 只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系 线性回归方程 07广东高考的一道出人意料的题 0 10 20 30 40 50 60 70 80 90 100 40 50 60 70 80 90 110 0 0.2 0.4 0.6 0.8 1 1.2 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 从散点图1可以看出因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域 从散点图2可以看出因变量随自变量的增大而减小则称作负相关,负相关的散点图中的点分布在左上角到右下角的区域. 从散点图3可以看出因变量与自变量不具备相关性 从图4可以看出因变量与自变量具备函数关系 散点图 3).如果所有的样本点都落在某一直线附近, 变量之间就有线性相关关系 . 1).如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系. 2).如果所有的样本点都落在某一函数曲线附近, 变量之间就有相关关系。 说明: 散点图可以用来判断两个变量是否具有相关关系. 下列关系属于负相关关系的是( ) A.父母的身高与子女的身高 B.农作物产量与施肥的关系 C.吸烟与健康的关系 D.数学成绩与物理成绩的关系 C 练习: 思考1:当人的年龄增加时,体内脂肪含量也增加,那么它到底是以什么方式增加的呢?我们观察年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点? 这些点大致分布在通过散点图中心的一条直线附近,我们称这两个变量之间具有线性相关关系,这条直线叫做回归直线。 知识探究(三):回归直线 ● 回归直线一定 过样本中心点 样本中心一定是样本数据点吗? 不一定! 样本中心 知识探究(四):回归方程 在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计. 整体上最接近 方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。 如何具体的求出这个回归方程呢? 方案二: 在图中选取两点画直线,使得直线两侧的点的个数基本相同。 方案三: 在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。 上述三种方案均有一定的道理,但可靠性不强 即:求回归方程的关键是如何用数学的方法来刻画 “从整体上看,各点与直线的偏差最小”。 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线就叫做回归直线。 回归直线定义: 0 20 25 30 35 45 50 55 60 x 年龄 5 10 15 20 25 30 35 40 y 脂肪含量 40 65 A B 思考6:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为 ,可以用哪些数量关系来刻画各样本点与回归直线的接近程度? 距离之和: 取最小值 取最小值 当a、b取什么值时Q最小? 人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法: 以上公式的推导较复杂,故不作推导,这一方法叫最小二乘法。 回归方程为 斜率b的意义? x每增加一个单位, y平均增加b个单位. 《全优课堂》45页 4 , 47页 3 思考7:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人65岁,则其体内脂肪含量的百分比约为多少? (0.577×65-0.448= 37.1%) 故:若某人65岁,可预测他体内脂肪含量在37.1%附近的可能性比较大。 思考8:能否说,65岁时他体内脂肪含量一定是 37.1%? 原因:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差,即使截距斜率没有误
文档评论(0)