[其它考试]统计分析培训.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[其它考试]统计分析培训

常用基本统计分析方法 -统计分析培训项目 汪涛 复旦大学公共卫生学院卫生统计教研室 taowang@shmu.edu.cn 二项分布资料的统计分析 二项分布 Binomial Distribution 二分类变量:有且只有两种结果的变量,如性别、死亡生存、复发未复发,一般用0和1表示其结果 Bernouli试验:具有两值结果的一次试验。条件:1、互斥的有且只有两种结果;2、独立性;3、每次关心结果的发生概率不变。 二项分布:进行的N次Bernouli试验中,所关心结果按不变概率?发生0、1、2、…、N-1、N次的概率分布 练习:4张牌里有一张A,放回抽样抽5次,抽到0,1,2,3,4张A的概率是多少?至少抽到2张A的概率? 二项分布的集中趋势和离散趋势 二项分布的均数 样本计数:X0=np 样本率:p 二项分布的方差 样本计数:Var(X)=np(1-p) 样本率:Var(p)=p(1-p)/n 二项分布近似正态分布 理论上 当N?和N(1- ?)均大于5时,或同样的,当X0和N-X0均大于5时,样本计数近似服从均数为N?,方差为N?(1- ?)的正态分布,样本率近似服从均数为?,方差为?(1- ?)/N的正态分布。 实际上 当Np和N(1- p)均大于5时,或同样的,当X0和N-X0均大于5时,样本计数近似服从均数为Np,方差为Np(1- p)的正态分布,样本率近似服从均数为p,方差为p(1- p)/N的正态分布。 二项分布 N人中B型血人数X的概率分布 举例:二项分布近似正态分布示意图 总体百分构成或总体率的统计推断 点估计 p ? ? 百分构成或率:p = X0/N 常规疗法治疗流行性出血热病人50例,死亡8例,病死率为16% 区间估计 查表法(基于二项分布的确切概率) 正态近似法 演习:随机抽查某乡村民100人,发现感染血吸虫者21人,该乡血吸虫感染率? 利用可信区间推断样本是否来自于一已知总体 查表法 正态近似法 演习:已知某地区血吸虫感染率为15%,现随机抽查某乡村民100人,发现感染血吸虫者21人,问该乡血吸虫感染率是否高于一般? 总体百分构成或总体率的统计推断 利用假设检验推断样本(样本率为p)是否来自于一已知总体(总体率为?0) 基本步骤 1、建立无效假设和备择假设H0:? = ?0; H1:? ? ?0 2、确定检验水准? = 0.05 3、在无效假设的前提下直接计算概率或利用正态近似法计算检验统计量后找到p值 a、确切概率法 b、正态近似法 4、根据概率或p值作出推断 演习:已知某地区血吸虫感染率为15%,现随机抽查某乡村民100人,发现感染血吸虫者21人,问该乡血吸虫感染率是否高于一般? 两个样本百分构成或两个样本率比较的统计分析 两个率比较的目的是其所代表的总体率相同,即:?1 = ?2 或 ?1 - ?2 = 0 (无效假设) 两个样本率之差的均数和方差 均数:p1 - p2 方差:S2(p1-p2)=p(1-p)(1/n1+1/n2),p=(X1+X2)/(n1+n2) 利用可信区间 利用假设检验 正态近似法 ?2检验法 演习:随机抽查A乡村民100人,发现感染血吸虫者21人,随机抽查B乡村民100人,发现感染血吸虫者15人,问AB两乡血吸虫感染率是否相同? Poisson分布资料的统计分析 Poisson分布 单位时间、面积、空间内所关心事件发生数的概率分布 二项分布数据当N很大X0很小(比例很低)时X的概率分布 例:沪闵高架1天中发生的交通事故数(注:交通事故发生的时间可以短至1秒)。 一个参数?(对于样本X0)。 Notation:X~P(?)。 练习:长期统计数据显示:沪闵高架一天发生交通事故5起,问今天发生0,1,2,3,4,5起交通事故的概率?最多(至少)发生3起的概率? Poisson分布的性质及其集中趋势和离散趋势 Poisson分布资料的性质 平稳性:样本计数大小只与观察单位的大小有关 独立性:各所关心事件的发生与否互不相关 普通性:所关心事件离散发生,无聚集性 Poisson分布的均数 样本计数:X0 Poisson分布的方差 样本计数:X0 Poisson分布的单位问题及正态近似 虽然观察单位不是Poisson分布的参数,但Poisson分布资料的统计分析一定要注意单位的转换 Poisson分布资料的可加性 观察单位的不可扩展性但可缩减性:大观察单位可转换为小观察单位但反之不可 Poisson分布的正态近似 当?(样本为X0)大于50时,样本计数X近似服从均数和方差均为? (样本为X0)的正态分布。 当?(样本为X0)大于50时,如将大观察单位缩减为1/n的小观察单位,转换后的样本计数X’服从均数为?/n (样本为X0/n),方差为?/n2(样本

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档