统计学概念及方法-第9章.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 两个分类变量的x2分析 主要内容 分类数据的检验 四格表及其独立性检验 1分类数据的检验 例 (Mendel的豌豆实验) 19世纪英国生物学家Mendel按颜色与形状把豌豆分为4类:黄而圆的,青而圆的,黄而有角度,青而有角的。遗传基因中,黄色是显性的,青色是隐性的;圆是显性的,有角是隐性的。Mendel指出这四类豌豆个数之比是9:3:3:1,即这四类豌豆的概率分别为9/16、3/16,3/16,1/16.他随机抽取了n=556颗豌豆,观察到这四类豌豆的个数分别为315、108、101、32。下面根据这些观察数据,对Mendel的遗传学理论进行检验。 分类数据检验问题 根据某项指标,总体被分为r类:A1, …,Ar。 H0:类Ai所占的比例为pi=pi0(i=1, …,r) 设n个个体中属于Ai类的实际观察个数为ni,则npi0为理论频数。Mendel提出的问题实际上就是考虑实际频数与理论频数有无偏离。 1900年,Pearson提出用 作为衡量实际频数与理论频数的偏差的指标。 套用上页公式计算Mendel豌豆实验中的数据,计算如下: 算得x2=0.47. 这里r=4,自由度为r-1=3.查x2表,得p值=0.925431,给定a=0.1或者0.05,显然,pa,故不拒绝H0.我们认为观察数据符合遗传学上四种豌豆符合9/16、3/16,3/16,1/16的比例。 例 某学校有十门新的选修课,下面的数字分别记录了选修每门课程的学生数。取水平0.05,检验:学生对这些课程的选择没有倾向性,即选各门课的人数比例相同。 这里H0:p=0.1,n=800,r=10 套用公式 算得x2=5.125,对应的P值=0.8232783490.05,故接受H0,学生对这些课程的选择没有倾向性,各门课选课人数的频率为0.1. 2四格表及其独立性检验 设A,B为两个属性,那么四格表的形式为: 其中:n1+=n11+n12, n2+=n21+n22 n+1=n11+n21, n+2=n12+n22 n=n11+n12+n21+n22 例 对肺癌患者和对照组的调查结果 : 四格表的独立性 考虑上例中吸烟与患肺癌有无关系,亦即A与B是否独立,若A、B二因素独立,则患肺癌与吸烟无关。 记p1=P(B|A),p2=P(B|没有A) 即p1=n11/n1+, p2=n21/n2+, 如果p1=p2,则属性A与属性B独立。 欲检验则属性A与属性B独立,只需检验: H0: p1=p2 检验统计量为: 对于上面的例子, 在excel中输入“=CHIDIST(9.664,1)”,得到p=0.001879,p0.05,故拒绝H0, p1和p2不独立,亦即吸烟与患肺癌有关。 例在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。 (1)2×2的列联表: (2)三维柱形图: 二维条形图: 等高条形图: (3)假设休闲方式与性别无关,计算 在excel中输入“=CHIDIST(6.20123,1)”,得到p= 0.012766 ,p0.025,故拒绝H0, p1和p2不独立,亦即有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关。 Excel2003中的部分统计函数 案例 :泰坦尼克号的真实故事 1912 年 4 月 10 日, “泰坦尼克号”从英国的南安普顿出发驶往美国纽约。富家少女罗丝与母亲及未婚夫卡尔一道上船,另一边,不羁的少年画家杰克靠在码头上的一场赌博赢到了船票。罗丝不愿嫁给卡尔,打算投海自尽,被杰克抱住。很快,罗丝与杰克相爱了。可没想到惨绝人寰的悲剧突然发生了,泰坦尼克号与冰山相撞。杰克把生存的机会让给了爱人罗丝,自己则在冰海中被冻死。这是美国电影《泰坦尼克号》里的凄美爱情故事。但是背后真实的情况又是怎样的呢?就让我们从泰坦尼克号的死亡记录来寻找一些答案吧。 号称“永不沉没”的“泰坦尼克号” ,重达 46328 吨,排水量 66000 吨,是当时世界上唯一超过四万吨吨位的客轮;其最高航行速度可达每小时 30 海里(约 55.6 公里) 。船身全长 260 米,最大宽度为 28 米;客轮上下共 11 层,拥有 762 个舱室、7 公里长的走廊和游步甲板。船上吃、喝、玩、乐设施应有尽有。船长和船员也经过严格的挑选,担

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档