相关关系、回归分析与独立性检验.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关关系、回归分析与独立性检验.doc

相关关系、回归分析与独立性检验(解析版) 一.考纲目标 利用散点图判断变量之间是否存在相关关系;求回归直线方程和利用回归直线作出估计;独立性检验. 二.知识梳理 1.两个变量的线性相关[来源:Z§xx§k.Com] (1)正相关. 在散点图中,点散布在从到的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关. 在散点图中,点散布在从到的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线. 如果散点图中点的分布从整体上看大致在,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法 求回归直线使得样本数据的点到它的的方法叫做最小二乘法. (2)回归方程 方程 = x+ 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中 , 是待定参数., , 3.残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为 i=yi- i=yi- xi- ,i=1,2,…,n. i称为相应于点(xi,yi)的残差. (2)相关指数R2=1-R2越大,意味着残差平方和,即模型的拟合效果R2越小,残差平方和,即模型的拟合效果.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果.4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量. (2)列联表:列出两个分类变量的,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2=(其中n=a+b+c+d为样本容量),则利用独立性检验判断表来判断“X与Y的关系”. [来源:Z.xx.k.Com] 在一组样本数据(x1,y1)、(x2,y2)、…、(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  ) A.-1 B.0C. D.1 [答案] D [解析] 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1. 要注意理清相关系数的大小与相关性强弱的关系. 某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值计算,得i=52,i=228,=478,iyi=1849,则其回归直线方程为(  ) A.=11.47+2.62x B.=-11.47+2.62x C.=2.62+11.47x D.=11.47-2.62x [答案] A [解析] 由i=52,i=228知,=6.5,=28.5,= =≈2.62, =-=28.5-2.62×6.5=11.47.在某医学实验中,某实验小组为了分析某药物用药量与血液中某种抗体水平的关系,选取六只验动物进行血检,得到如下资料: 动物编号 1 2 3 4 5 6 用药量x(单位) 1 3 4 5 6 8 抗体指标y(单位) 3.4 3.7 3.8 4.0 4.2 4.3 记s为抗体指标标准差,若抗体指标落在(-s,+s)内,则称该动物为有效动物,否则称为无效动物.研究方案规定先从六只动物中选取两只,用剩下的四只动物的数据求线性回归方程,再对被选取的两只动物数据进行检验. (1)求选取的两只动物都是有效动物的概率; (2)若选取的是编号为1和6的两只动物,且利用剩余四只动物的数据求出y关于x的线性回归方程为=0.17x+a,试求出a的值; (3)若根据回归方程估计出的1号和6号动物抗体指标数据与检验结果误差都不超过抗体指标标准差,则认为得到的线性回归方程是可靠的.试判断(2)中所得线性回归方程是否可靠. 参考公式:样本数据x1,x2,…,xn的标准差: S=,其中为样本平均数. [解析] (1)=3.9,s≈0.31.故1、6号为无效动物,2、3、4、5号为有效动物. 记从六只动物中选取两只为事件A. 所有可能结果为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15种. 满足题意的有(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共6种.故P(A)==. (2)对于2、3、4、5号动物,=4.5,=3.925,代入=0.17x+a得a=3

文档评论(0)

wuyouwulu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档