统计案例复习幻灯片.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
; 统计案例 要点梳理 1.回归分析 (1)定义:对具有 的两个变量进行统计 分析的一种常用方法. (2)随机误差:线性回归模型用y=bx+a+e表示,其 中a和b为模型的 , 称为随机误差. (3)样本点的中心 在具有线性相关关系的数据(x1,y1), (x2,y2), …,(xn,yn)中,回归方程的截距和斜率的最小二乘 估计公式分别为:;其中 称 为样本点的中心. (4)相关系数;②当r >0时,表明两个变量 ; 当r <0时,表明两个变量 . r 的绝对值越接近于1,表明两个变量的线性相关性 .r 的绝对值越接近于0时,表明两个变量之间 .通常|r|大于 时,认 为两个变量有很强的线性相关性.;2.残差分析 (1)总偏差平方和 把每个效应(观测值减去总的平均值)的平方加起来即: . (2)残差 数据点和它回归直线上相应位置的差异(yi- ) 是 的效应,称 为残差. (3)残差平方和 .;3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 ,像这类变量称为分类变量.; (2)列联表:列出两个分类变量的 ,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为 2×2列联表;构造一个随机变量K2= , 其 中n= 为样本容量. (3)独立性检验 利用随机变量 来确定是否能以一定把握认为“两 个分类变量 ”的方法称为两个分类变量的独 立性检验.;基础自测 1.相关系数度量 ( ) A.两个变量之间线性相关关系的强度 B.散点图是否显示有意义的模型 C.两个变量之间是否存在因果关系 D.两个变量之间是否存在关系 解析 相关系数来衡量两个变量之间线性相关关系的强弱.;2.甲、乙、丙、丁四位同学各自对A、B两变量的线性 相关性作试验,并用回归分析方法分别求得相关系 数r与残差平方和m如下表:;3.已知x、y之间的数据如表所示,则回归直线过点 ( ) A.(0,0) B.( ,0) C.(0, ) D.( , ) 解析 回归直线过样本点的中心( , ).;4.下列说法中正确的有:①若r>0,则x增大时,y也相应 增大;②若r<0,则x增大时,y也相应增大;③若r=1 或r=-1,则x与y的关系完全对应(有函数关系),在 散点图上各个点均在一条直线上 ( ) A.①② B.②③ C.①③ D.①②③ 解析 若r>0,表示两个相关变量正相关,x增大时,y 也相应增大,故①正确.r<0,表示两个变量负相关, x增大时,y相应减小,故②错误.|r|越接近1,表示两 个变量相关性越高,|r|=1表示两个变量有确定的关系 (即函数关系),故③正确.;5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的(有关,无关). 解析 ∵K2=27.63>10.828, ∴有99.9%的把握认为“打鼾与患心脏病有关”.;题型一 线性回归分析 【例1】假设关于某种设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:;(3)如果x与y具有线性相关关系,求出线性回归方程; (4)估计使用年限为10年时,维修费用约是多少? (1)先根据已知计算相关系数r,判断是否具有相关关系. (2)再利用公式求出回归方程进行回归分析. 解 (1);(2)步骤如下: ①作统计假设H0:x与y不具有线性相关关系. ②n-2=3时,r0.05=0.878. ③ =112.3-5×4×5=12.3, =90-5×42=10, =140.8-125=15.8, ∴r= ④|r|=0.987>0.878,即|r|>r0.05, 所以有95%的把握认为“x与y之间具有线性相关关 系”,去求线性回归方程是有意义的.;所以线性回归方程为 =1.23x+0.08. (4)当x=10时, =1.23×10+0.08=12.38(万元), 即估计使用10年时,维修费用约为

文档评论(0)

mwk365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档