- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.2 回归分析(一)
一、知识梳理
1.回归直线方程
在回归直线方程=+x中,==,=-.其中=xi,=yi.,称为样本点的中心,回归直线过样本点的中心.
2.相关系数
(1)对于变量x与y随机抽到的n对数据(x1,y1),(x2,y2),…,(xn,yn),检测统计量是样本相关系数
r==.
(2)相关系数r的取值范围是,|r|值越大,变量之间的线性相关程度越高;|r|值越接近0,变量之间的线性相关程度越低.当|r|r0.05时,表明有95%的把握认为两个变量之间有线性相关关系.
探究点一 回归直线方程
回归分析中,利用回归直线方程求出的函数值一定是真实值吗?为什么?
探究点二 相关性检验
思考1 给出n对数据,按照公式求出的回归直线方程,是否一定能反映这组成对数据的变化规律?
思考2 怎样理解相关系数?
对一组数据进行线性回归分析时,应先画出其散点图,看其是否是直线形,再依次代入系数、的计算公式,算出、.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.求线性回归方程的步骤:计算平均数,;计算xi与yi的积,求∑xiyi;计算∑x;将结果代入公式求;用=-求;写出回归直线方程.
例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据女大学生的身高预报体重的回归方程,并预报一名身高为172 cm的女大学生的体重.跟踪训练1以下是某地搜集到的新房屋的销售价格Y和房屋的面积x的数据:
房屋面积(m2) 110 90 80 100 120 销售价格(万元) 33 31 28 34 39 画出数据对应的散点图.
求回归直线方程.
据的结果估计当房屋面积为150 m2时的销售价格.
反思与感悟 (1)只有当两个变量之间存在线性相关关系时,才能用回归直线方程估计和预测.如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测的量也是不可信的.
(2)我们可以利用回归直线方程进行预测,但这里所得到的值是预报值,而不是精确值.这是根据统计规律所得到的结论,因而所得出结论正确的概率是最大的,故可以放心大胆地利用回归直线方程进行预测.
1.借助于散点图可大致判定两变量间的相关性,用相关系数公式可准确判定两变量间的相关程度.
2.先作统计假设,由小概率0.05与n-2在附表中查得相关系数的临界值r0.05,若|r|r0.05,则两变量线性相关,否则两变量不具有线性相关性.例2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:
甲醛浓度(g/L) 18 20 22 24 26 28 30 缩醛化度(克分子%) 26.86 28.35 28.75 28.87 29.75 30.00 30.36 (1)画散点图;
(2)求回归直线方程;
(3)求相关系数r,并进行相关性检验.
判断两个变量之间是否线性相关一般有两种方法
(1)作出散点图,由图观察可知是否具有线性相关关系,再求回归方程;
(2)求两变量的相关系数r,相关系数的范围为-1≤r≤1.相关系数为正数,表示两变量之间为正相关;相关系数为负数,表示两变量之间为负相关,相关系数r的绝对值的大小表示相关程度的高低.此外还可以先由散点图判断,然后再用相关系数进行相关性检验,若存在相关性,再代入回归系数计算公式求出,,写出回归直线方程;若不相关,则求回归直线方程毫无意义.
跟踪训练2 为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2007年至2012年的情况,得到了下面的数据:
年份 2007 2008 2009 2010 2011 2012 x(℃) 24.4 29.6 32.9 28.7 30.3 28.9 y(日) 19 6 1 10 1 8 (1)对变量x、y进行相关性检验;
(2)据气象预测,该地区在2013年3月下旬平均气温为27℃,试估计2013年4月化蛹高峰日为哪天.
1.下列各组变量之间具有线性相关关系的是( )
A.出租车费与行驶的里程
B.学习成绩与学生身高
C.身高与体重
D.铁的体积与质量
2.对变量y和x进行相关性检验,已知n为数据的对数,r是相关系数,且已知①n=3,r=0.995 0;②n=7,r=0.953 3;③n=15,r=0.301 2;④n=17,r=0.499 1.
文档评论(0)