- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE1
第02讲成对数据的统计分析
【必备知识】
1、变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关.
2、样本相关系数
(1)样本相关系数
(2)当,成对样本数据正相关;当时,成对样本数据负相关.
(3)当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
3、一元线性回归模型
(1)经验回归方程为,其中.
(2)残差分析
①观测值:通过观测得到的数据.
②预测值:通过经验回归方程得到的.
③残差:观测值减去预测值的差.
④残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.这方面的工作称为残差分析.
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
4.独立性检验
(1)假定通过简单随机抽样得到了X和Y的抽
样数据列联表,如表所示.
则.
(2)独立性检验
当时,推断不成立,即认为和不独立,该推断犯错误的概率不超过α;
当时,没有充分证据推断不成立,可以认为和独立.
利用χ2的取值推断分类变量和是否独立的方法称为独立性检验,简称独立性检验.
考点04相关关系的判断
【常见方法】判断相关关系的方法:
(1)回归方程法:利用回归方程中的系数的正负判断.
(2)散点图法:如果所有的样本点都落在某一曲线附近,那么变量之间就有相关关系;如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系.
(3)相关系数法:利用相关系数判断,|r|越趋近于1,相关性越强.
【典例分析04】
1、为了对变量x与y的线性相关进行检验,由样本点(x1,y1)、(x2,y2)、…、(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中正确的是()
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若越大,则变量x与y的线性相关性越强
D.若越小,则变量x与y的线性相关性越强
2、下列命题中正确的为()
A.线性相关系数r越大,两个变量的线性相关性越强
B.线性相关系数r越小,两个变量的线性相关性越弱
C.残差平方和越小的模型,模型拟合的效果越好
D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
3、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()
A.y=a+bxB.y=a+bx2
C.y=a+bexD.y=a+blnx
考点05线性回归方程
角度01线性回归方程及其应用
【常见方法】求线性回归方程的基本步骤
(1)先把数据制成表,从表中计算出x、y,xeq\o\al(\s\up1(2),\s\do1(1))+xeq\o\al(\s\up1(2),\s\do1(2))+…+xeq\o\al(\s\up1(2),\s\do1(n))、x1y1+x2y2+…+xnyn的值;
(2)计算回归系数;
(3)写出线性回归方程.
注意:回归方程一定过点(x,y).
【典例分析05】
1、某食品厂2020年2月至6月的某款饮料生产产量(单位:万件)的数据如下表:
月份x
2
3
4
5
6
生产产量y/万件
3
5
6.5
8
10.5
(1)根据以上数据,求y关于x的线性回归方程;
(2)调查显示该年7月份的实际市场需求量为13.5万件,求该年7月份所得回归方程预测的生产产量与实际市场需求量的误差.
参考公式:,.
角度02相关系数及其应用
【常见方法】1.模型拟合效果的判断
(1)残差平方和越小,模型的拟合效果越好;
(2)决定系数R2越大,模型的拟合效果越好;
(3)回归方程的拟合效果,可以利用相关系数判断.当|r|越趋近于1时,两变量的线性相关程度越强.
2.确定残差系数
.其中是残差平方和,其值越小,则越大(接近1),模型的拟合效果越好.
2、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据
您可能关注的文档
- 2019-2020学年度人教版六年级下册毕业模拟检测数学试卷(一).pdf
- 2019-2020学年度人教版六年级下册初一分班测试数学试卷.pdf
- 2019-2020学年度人教版六年级下册期中测试数学试卷.docx
- 2019-2020学年度人教版六年级下册期中测试数学试卷.pdf
- 2019-2020学年度人教版六年级下册小升初模拟测试数学试卷.pdf
- 2019-2020学年度人教版数学六年级下册4.1.3 解比例练习卷.docx
- 2019-2020学年度人教版数学六年级下册4.1.3 解比例练习卷.pdf
- 2023--2024学年度第一学期基础质量监测六年级地理试题.docx
- 2023--2024学年度第一学期基础质量监测六年级地理试题.pdf
- PROE CREO插件-云图工具挂载教程.docx
最近下载
- 养老院门卫管理制度.pdf VIP
- 电力设施保护条例实施细则.pdf VIP
- 统编语文三年级上册第七单元《口语交际:身边的“小事” 》.pptx VIP
- 2024年中央纪委国家监委驻中国邮政集团有限公司招聘笔试参考题库附带答案详解.pdf VIP
- 《大学生创新创业基础》 第六章 市场调查与营销策略.pptx
- 建筑防水工程施工质量监理实施细则hg.doc VIP
- 环境材料概论 课件全套 第1--9章 绪论、吸附材料 ---环境材料的绿色设计.pptx
- 中职英语英语教学计划.docx VIP
- HGT2226-2019普通工业沉淀碳酸钙.pdf VIP
- 3肖仰华-大规模知识图谱构建与应用.pdf VIP
文档评论(0)