- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 
                        查看更多
                        
                    
                  回归直线及方程 年龄 脂肪含量 方案一:先画一条直线,测量出各点与它的距离,然后移动 直线,到达一个使距离的和最小的位置,测量出此时的斜 率和截距,就可得到回归方程了. 但是,这样做可靠吗? 操作性比较困难 年龄 脂肪含量 方案二:在图中选择这样的两点画直线,使得直线两侧的 点的个数基本相同.                                这样做能保证各点此与直线在整体 上是最接近的吗? 准确性不高       从散点图我们可以看出,年龄越大,体内脂肪含量越高.  那么当人的年龄增加时,体内脂肪到底是以什么方式增加的呢?     如果散点图中点的分布从整体上看大致在一条直线 附近,我们就称这两个变量之间具有线性相关关系,这条 直线叫做回归直线.如果能够求出这条回归直线的方程 (简称回归方程),那么我们就可以比较清楚地了解年龄与 体内脂肪含量的相关性,就像平均数可以作为一个变量的 数据代表一样,这条直线可以作为两个变量具有线性相关 关系的代表. 那么,我们应当如何具体求出这个回归方程呢?        我们还可以找到更多的方法,但这些方法都可行吗?科学吗?准确吗?怎样的方法是最好的?         我们把由一个变量的变化去推测另一个变量的方法称为回归方法。 年龄 脂肪含量 方案三:在图中多取几组点,确定出几条直线的方程,再分 别求出各条直线的斜率、截距的平均数,将这两个平均 数当成回归方程的斜率和截距. 同学们不妨去实践一下,看看这些方法是不是真的可行?        这样,用这n个偏差的和来刻画”各点与此直线的整体 偏差”是比较合适的,但由于它含有绝对值,运 算不太方便,所以改用:  ①        这样,问题就归结为:当a,b取什么值时Q最小,即总体 偏差最小.经过数学上求最小值的运算,求a,b的公式为: ②         实际上,求回归方程的关键是如何利用数学的方法 来刻画“从整体上看,各点与此直线的距离最小”. 怎样理解呢? 假设我们已经得到两个具有线性相关关系变量的一组数据                 (x1,y1), (x2,y2), …, (xn,yn). 且所求回归方程是                    ,其中a,b是待定系数. (x1, y1) (x2,y2) (xi,yi) (xn,yn)     我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式: 以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。(参看如书P88) 例2:观察两相关变量得如下表: x -5 -4 -3 -2 -1 1 3 2 4 5 y -9 -7 -5 -3 -1 1 5 3 7 9 求两变量间的回归方程 解: 最小二乘法求回归直线方程: (1)公式: 回归方程为: 解1: 画散点图:       由散点图可知,两者之间不具有线性相关关系,求回归直线方程无意义。 求线性回归直线方程的步骤: 第一步:列表                                     ;                   第二步:计算                                         ;                         第三步:代入公式计算b,a的值; 第四步:写出直线方程。     总结 二、求线性回归方程 例1:观察两相关变量得如下表: x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9        判断两变量的相关关系,求回归直线方程有意义吗? 列表: i 1 2 3 4 5 6 7 8 9 10 -5 -4 -3 -2 -1 1 3 2 4 5 -9 -7 -5 -3 -1 1 5 3 7 9 45 28 15 6 1 1 15 6 28 45 计算得: ∴所求回归直线方程为 y=     x ^ (3)从散点图可以看出,这些点大致分布在一条直线附近。 Y=-2.352x+147.767 ^ (4)当 x = 2时,y =143.063,因此,这天大约可以卖出143杯热饮。 ^ 例2:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度   -5     0    4     7    12   15   19  23   27   31   36 热饮杯数 156 150 132 128 130 116 104  89  93   76   54  (1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间
                
原创力文档
                        

文档评论(0)