- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
变量间的相关关系与统计案例
【考点梳理】
1.
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数.
(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.
2.
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则==,=-.其中,是回归方程的斜率,是在y轴上的截距.
3.
(1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为i=yi-i=yi-xi-,i=1,2,…,n,i称为相应于点(xi,yi)的残差.
(2)相关指数:R2=1-.
4.
(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 则随机变量K2=(其中n=a+b+c+d为样本容量).相关关系的判断例1(1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.
x,y是负相关关系;
在该相关关系中,若用y=c1拟合时的相关指数为R,用=x+拟合时的相关指数为R,则R>R;
x,y之间不能建立线性回归方程.
(1)C (2)①② (1)因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=y+,0,则z=y+=-0.1x++,故x与z负相关.
(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;由散点图知用y=c1拟合比用=x+拟合效果要好,则R>R,故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误.
类题通法1.利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,若点散布在左上角到右下角的区域,则负相关.
2.利用相关系数判定,当|r|越趋近于1,相关性越强.
当残差平方和越小,相关指数R2越大,相关性越强..四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
y与x负相关且=2.347x-6.423;y与x负相关且=-3.476x+5.648;y与x正相关且=5.437x+8.493;y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是 ( )
A.①② B.②③C.③④ D.①④
D
[解析]由正负相关性的定义知一定不正确.2.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙C.丙 D.丁
D
[解析]在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性.
线性回归方程及应用例2如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2008~2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
参
您可能关注的文档
- 税务代理实务·课后练习第五章建账建制代理记账实务.doc
- 限购令的合法性探析——兼论房价调控中的法治问题.doc
- 四川省土地估价师《基础与法规》知识:登记条例模拟试题.doc
- 三年级上册科学导学.doc
- 韩国必买护肤品4篇.doc
- 初中毕业赠言给学生.doc
- 新概念快速作文在小学语文教学中的应用.docx
- 初中学生英语教学论文7篇.docx
- 红宝书gmat词汇精选.doc
- 微信同学群祝福短语.doc
- 【《心理契约理论下创维电视公司员工激励探析》文献综述开题报告2700字】 .docx
- 2025年高考化学复习备考策略讲座 (2).pdf
- 宁波市轨道交通物产置业有限公司2024年社会招聘岗位人员笔试考试考点题库答案 .pdf
- 国家开放大学专科《人文英语1》一平台机考总题库 (2).pdf
- 冷鲜肉生产线项目可行性研究报告 .docx
- 卷烟封装设备操作工职业鉴定考试题及答案 .pdf
- 《长虹美菱基于自由现金流折现法估值》.docx
- 【《数据分类与权利客体可能性探析综述》3000字】 .docx
- 《2.2.1有理数的混合运算》大单元教学设计 北师大版数学七年级上册 .pdf
- 2025年高考物理复习备考策略讲座 .pdf
文档评论(0)