1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计6章

第六章 ;第一节 二项分布 ;分类资料:将观察单位按某种属性或类别分组,计分类个体数。最简单——分两类 总体:总个体数 某类个体数 非某类个体数 总体率(构成比);样本:含量: 某类个体数 非某类个体数 样本率(构成比);案例2: 抛一枚均匀硬币, 正面朝上的出现次数X及其概率: 0 (正面朝下) 1 (正面朝上) π 0.5 0.5 如果将此试验重复若干次,如10次,正面朝上的出现次数 X 可以为0,1,2,…,10, 则正面朝上的出现次数 X 的分布即为二项分布。;定义:;二项函数 展开式的通项 式中 且总有;二项分布有两个参数: 总体率 样本含量 记作:X~B(n,π) X 服从试验次数为n 和“阳性”的概率为π的二项分布 ;例6-1 某种药物治疗某种非传染性疾病的有效率为0.70。今用该药治疗该疾病患者10人,试分别计算这10人中有6人、7人、8人有效的概率。 本例n=10,π=0.70,X=6,7,8。按公式(6-1)计算相应的概率为 0.20012 ; ;一、二项分布的适用条件和性质 (一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果之一,即两种对立结果的概率之和恒等于1;(π,1- π) 2. 每次试验产生某种结果(如“阳性”)的概率固定不变; 3. 重复试验是相互独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。 ;(二) 二项分布的性质 1. 二项分布的均数与标准差 在n次独立重复试验中,出现“阳性”次数X 的 总体均数为 总体方差为 总体标准差为 ;若以率表示,则样本阳性率p (p=0/n,1/n,2/n,…,n/n)也服从二项分布,其 总体均数为 总体方差为 总体标准差为 ;样本率的标准差也称为率的标准误,可用来描述样本率的抽样误差,率的标准误越小,则率的抽样误差就越小。 在一般情形下,总体率π往往并不知道。此时若用样本资料计算样本率p=X/n作为π的估计值,则 的估计为: ; 对于二项分布而言,当π=0.5时,分布是对称的,见图6-1; ;当 0.5时,分布是偏态的,但随着n的增大,分布趋于对称。当n 时,只要π不太靠近0或1,二项分布则接近正态分布,见图6-2。 ;图6-2. =0.4时,不同n值下的二项分布图;二、二项分布的应用 (一)总体率的区间估计 1. 查表法 对于n 50的小样本资料,直接查附表6百分率的95%或99%可信区间表,即可得到其总体率的可信区间。 ;例6-2 在对13名输卵管结扎的育龄妇女经壶腹部-壶腹部吻合术后,观察其受孕情况,发现有6人受孕,据此资料估计该吻合术妇女受孕率的95%可信区间。; 附表6只列出 的部分。当 时,可先按“阴性”数n-X 查得总体阴性率的 可信区间QL~QU,再用下面的公式转换成所需的阳性率的 可信区间。 PL=1-QU, PU=1-QL ;2. 正态近似法 根据数理统计学的中心极限定理可得,当n 较大、π不接近0也不接近1时,二项分布B(n,π)近似正态分布 ,而相应的样本率p 的分布也近似正态分布 。 为此,当n 较大、p 和1-p 均不太小如 np 和n(1-p)均大于5时,可利用样本率p的分布近似正态分布来估计总体率的 可信区间。 ; 的 可信区间为: 如: 的95%可信区间为 的99%可信区间为 ;;(二)样本率与总体率的比较( 与 的比较 ) 1.直接法 可利用二项分布直接计算有关概率,对样本率与总体率的差异进行有无统计学意义的比较。 比较时,在总体阳性率为π的n次独立重复试验中,一般有下面几种情形的概率计算:;(1)回答“差”或“低”的问题,则需计算出现“阳性”的次数至多为k次的概率为: (2)回答“优”或“高”的问题,则需计算出现“阳性”的次数至少为k次的概

文档评论(0)

ahuihuang1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档