2.3.2两个变量的线性相关1.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.3.2两个变量的线性相关1

2.3.2 两个变量的线性相关 * 例1:下表是某小卖部6天卖出热茶的杯数与当天气温的对比表: 64 50 38 34 24 20 杯数 -1 4 10 13 18 26 气温/℃ (1)将上表中的数据制成散点图. (2)你能从散点图中发现温度与饮料杯数近似成什么关系吗? (3)如果近似成线性关系的话,请画出一条直线方程来近似地表示这种线性关系. (1)画出散点图: 温度 杯数 (2)从图中可以看出温度与杯数具有相关关系,当温度由小到大变化时,杯数的值由大到小. 所以温度与杯数成负相关. 图中的数据大致分布在一条直线附近,因此温度与杯数成线性相关关系。 (3)根据不同的标准,可以画出不同的直线来近似地表示这种线性关系。 如可以连接最左侧和最右侧的点,或者让画出的直线上方的点和下方的点的数目相同。 温度 杯数 温度 杯数 由图可见,所有数据的点都分布在一条直线附近,显然这样的直线还可以画出许多条,而我们希望找出其中的一条,它能最好地反映x与Y之间的关系。 换言之,我们要找出一条直线,使这条直线“最贴近”已知的数据点。记此直线方程是 这里在y的上方加记号“^”,是为了区分Y的实际值y. 表示当x取xi (i=1,2,…,6)时,Y相应的观察值为yi,而直线上对应于xi的纵坐标是yi=bxi+a. ^ 上式叫做Y对于x的回归直线方程, b叫做回归系数。 要确定回归直线方程,只要确定a与b. 回归直线的方程 的求法: 设x,Y的一组观察值为 (xi,yi) (i=1,2 …,n) 且回归直线的方程为 当变量x取xi (i=1,2,…,n)时,可以得到: (i=1,2,…,n), 它与实际收集到的yi之间的偏差是: (i=1,2,…,n), 可见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表n个点与相应直线在整体上的接近程度。故采用n个偏差的平方和 表示n个点与相应直线在整体上的接近程度. 记 (∑为连加符号) 上式展开后,是一个关于a,b的二次多项式,应用配方法,可求使Q取得最小值时a、b的值. 这样,回归直线就是所有直线中Q取最小值的那一条。由于平方又叫做二乘方,所以这种使“离差平方和为最小”的方法,叫做“最小二乘法”。 用最小二乘法求回归直线方程中a,b有下面的公式: 其中 同样a,b的上方加“^”,表示是由观察值按最小二乘法求得的估计值。 由于 ,故巧合的是:(xi,yi) (i=1,2,…,n)的中心点 在回归直线上,x处的估计值为 . 例2. 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度Y与腐蚀时间x之间相应的一组观察值如下表: 46 29 25 23 19 17 16 13 10 10 6 Y/μm 120 90 70 60 50 40 30 20 15 10 5 x/s (1)画出表中数据的散点图; (2)求Y对x的回归直线方程; (3)试预测腐蚀时间为100时腐蚀深度是多少? 解:(1)散点图如下 (2)根据公式求腐蚀深度Y对腐蚀时间x的回归直线方程。 13910 36780 214 510 ∑ 5520 14400 46 120 11 2610 8100 29 90 10 1750 4900 25 70 9 1380 2600 23 60 8 950 2500 19 50 7 680 1600 17 40 6 480 900 16 30 5 260 400 13 20 4 150 225 10 15 3 100 100 10 10 2 30 25 6 5 1 xy x2 Y x 序号 计算a, b的值. ^ ^ 由上表分别计算x,y的平均数得 写出回归方程为y=0.304x+5.346. ^ (3)根据求得的回归方程,当腐蚀时间为100s时, y=0.304×100+5.346=38.86(μm) ^ 即腐蚀深度约为38.86μm. 练习题 1.下列说法正确的是( ) (A)y=2x2+1中的x,y是具有相关关系的两个变量 (B)正四面体的体积与其棱长具有相关关系 (C)电脑的销售量与电脑的价格之间是一种确定性的关系 (D)传染病医院感染“非典”的医务人员数与医院收治的“非典”病人数是具有相关关系的两个变量 D

文档评论(0)

jixujianchi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档