- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
变量间的相关关系__统计案例
[知识能否忆起]
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
二、两个变量的线性相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
2.回归方程为=x+,其中=,
=-.
3.通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
4.相关系数=,
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
三、独立性检验
1.2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y1 y2 合计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d
K2=(其中n=a+b+c+d为样本容量).
2.用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.
3.当K2>3.841时,则有95%的把握说事件A与B有关;
当K2>6.635时,则有99%的把握说事件A与B有关;
当K2>2.706时,则有90%的把握说事件A与B有关.
[小题能否全取]
1.(教材习题改编)观察下列各图形
其中两个变量x、y具有相关关系的图是( )
A. B.
C. D.
解析:选C 由散点图知具有相关关系.
2.(教材习题改编)已知变量x,y之间具有线性相关关系,其回归方程为=-3+bx,若i=17,i=4,则b的值为( )
A.2 B.1
C.-2 D.-1
解析:选A 依题意知,==1.7,==0.4,而直线=-3+bx一定经过点(,),所以-3+b×1.7=0.4,解得b=2.
3.在一次对性别与说谎是否相关的调查中,得到如下数据:
说谎 不说谎 合计 男 6 7 13 女 8 9 17 合计 14 16 30
根据表中数据,得到如下结论中正确的一项是( )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
解析:选D 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.
4.某考察团对全国10大城市的居民人均工资收入x(万元/年)与居民人均消费y(万元/年)进行统计调查,发现y与x具有相关关系,且y对x的回归方程为=0.66x+1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为________.
解析:因为当=7.675时,x=≈9.262,
则≈0.829≈83%.
答案:83%
5.已知x,y之间的数据如表所示,则回归直线过点________.
x 1 2 3 4 5 y 1.2 1.8 2.5 3.2 3.8
解析:=3,=2.5,
样本点中心为(3,2.5),回归直线过样本点中心.
答案:(3,2.5)
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.
2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.
3.使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.
相关关系的判断
典题导入
[例1] (2012·新课标全国卷)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
[自主解答] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
[答案] D
由题悟法
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关性判断时,若散点图呈带状且
文档评论(0)