第十一章概率与统计 第八课时.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章概率与统计 第八课时

解析:(1)列联表 89 57 32 总计 34 26 8 男 55 31 24 女 总计 不晕船 晕船 (2)假设 :“晕船与性别无关”,由公式得K2≈3.689,因为K2>2.706,所以我们有90%的把握说晕船与性别有关(女人更容易晕船). 1.虽然两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好.为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型. 2.独立性检验的必要性:为什么不能只凭列联表和图形下结论?原因是列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此需要用列联表检验这个方法来确认所得结论在多大程度上适用于总体. 3.独立性检验的思想来自于统计上的假设检验思想,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事情发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生. 4.K2与k的关系并不是k= ,k是K2的观测值,或者说K2是一个随机变量,它在a,b,c,d取不同的值时,K2可能不同,而k是取定一组数a,b,c,d后的一个确定的值. 1.(2011·湖南卷) 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 110 50 60 总计 50 30 20 不爱好 60 20 40 爱好 总计 女 男 附表: 参照附表,得到的正确结论是(  ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关” 10.828 6.635 3.841 k 0.001 0.010 0.050 P(K2≥k) * 第十一章 概率与统计     第八课时 统计案例 1.了解下列两种常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立检验 了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析 2.了解回归的基本思想、方法及其简单应用. 考纲要求 知识梳理 一、残差分析 1.线性回归模型 y=bx+a+e中,a,b叫做模型的未知参数,e叫做随机误差. 我们可以建立回归方程 为bx+a中的估计量,由于 ,所以 是e的估计量,这样,对于样本点(i=1,2,…,n)相对于它们的随机误差为ei=yi- =yi-bxi-a(i=1,2,…,n),其估计值为 (i=1,2,…,n), 称为相应于样本点(i=1,2,…,n)的残差. 2.残差平方和 Q= 当Q的值越小,说明线性回归模型的拟合效果越好. 3.相关指数 用相关指数R2来刻画回归的效果,其计算公式是: R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好. 二、独立性检验 1.用变量的不同“值”表示个体所属的不同类别,这种变量成为分类变量.例如:是否吸烟,宗教信仰,国籍等. 2.列出两个变量的频数表,成为列联表. 3.一般地,假设有两个分类变量X和Y,它们的值域分别是{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为 2×2列联表 a+b+c+d b+d a+c 总计 c+d d c x2 a+b b a x1 总计 y2 y1 K2= (其中n=a+b+c+d为样本容量),则利用独立性检验判断表来判断“x与y的关系”. 注意:常将k= 叫做K2的观测值. 这种利用随机变量K2(或说用K2的观测值k)来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 经过对统计量分布的研究,已经得到了两个临界值:3.841与6.635.当根据具体的数据算出的观测值k>3.841时,有95%的把握说事件A与B有关;当k>6.635时,有99%的把握说事件A与B有关;当k≤3.841时,认为事件A与B是无关的. 基础自测 1.用独立性检验来考察两个变量x与y是否有关系,当统计量K2的值(  ) A.越大,“x与y是有关系

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档