网站大量收购独家精品文档,联系QQ:2885784924

Poisson分布和回归课件.pptVIP

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Poisson回归 何平平 北大医学部流行病与卫生统计学系 Tel一、Poisson分布的定义及特点 以放射性脉冲计数为例。将一段规定时间内平均放射的脉冲数记为?,把这段时间等分为n份, 则每小段时间内平均放射的脉冲数为? /n。假定: ? n足够大,以致在每一小段时间内有或无脉冲,出现2个及以上脉冲的机会可以忽略(大量、有或无)。 每小段时间内出现脉冲的概率都是? /n (重复、小概率)。 不同时间段内脉冲出现与否是独立的(独立)。 在这n小段时间内出现的脉冲总数X服从二项分布B(n,? /n),概率函数为 当n趋于?时,P(X=x)的极限为 上式中,常令 ? /n =?。 令罕见事件发生数为X,若X的发生概率P(X) 则称X服从参数为μ的Poisson 分布,记为X~P( μ)。其中X为单位时间(或面积、容积等)某罕见事件发生数,μ是Poisson 分布的总体均数。 Poisson 分布常用于描述单位时间、单位面积或空间中罕见事件发生数的分布规律。观察单位与发生事件一般不对应。 Poisson分布的定义 罕见事件发生数 ? 放射性物质单位时间内的放射次数 ? 单位体积内粉尘的计数 ? 显微镜下细胞或微生物计数 ? 单位面积内细菌计数 ?发病率很低的疾病(不具传染性、无永久免疫、无遗传性)在人群中的发病数。 Poisson分布的特点 事件的发生是完全随机; ? 事件发生与否是独立的; ? 事件发生的概率P不变; ? Poisson分布的总体均数为μ; ? Poisson分布的均数和方差相等, μ=σ2。 Poisson 分布、正态分布及二项分布的关系 当μ较小时, Poisson分布呈偏态分布,随着μ增大,迅速接近正态分布,当μ≥20时,可以认为近似正态分布。 Poisson分布是二项分布的特例,某现象的发生率 π很小,而样本例数n很大时,则二项分布接近于 Poisson分布。 μ = n π (应用: Poisson替代二项 分布) 例1:某车间在生产工艺改革前后各测1次粉尘浓度,每次测1升空气,分别测得39和25颗粉尘。请据此推断改革前后粉尘浓度是否相同? P0.05,认为该车间改革前后粉尘浓度相同。 1.当观察单位相同时两样本比较 二、Poisson分布的Z检验 例2:某车间在生产工艺改革前测3次粉尘浓度,每次测1升空气,分别测得38,29和36颗粉尘;改革后测2次,分别由25和18颗粉尘。请据此推断改革前后粉尘浓度是否相同? P0.05,认为该车间改革前后粉尘浓度不同。 2.当观察单位不同时两样本比较 三、Poisson回归 1.基本原理 用于分析服从Poisson分布的罕见事件发生数(或率)与一组解释变量之间的关系,常用对数线性模型进行分析 。 令有k个解释变量X1,X2,…,Xk, 其中Log(n)称为偏移量(Offset)。 2. 假设检验 (1)模型检验(拟合优度检验):当P0.05,说明可以接受拟合的模型。 似然比检验(the likelihood ratio test) Pearson卡方检验 评价模型拟和的好坏:大多数单元格的标准化残差或调整残差的 绝对值小于2。 (2)自变量检验: 检验回归系数是否为零。 RR的意义。 假定X1为二分类变量(取值为0和1),则固定其他变量时,RR=EXP(?1) 例3: 变量说明:E:是否吸烟,1=吸烟;2=不吸烟;N:肺癌发生数,PT:人年。 先按照变量N进行加权,再统计分析 RR:1.611(1.140,2.278) 例4:某车间在生产工艺改革前后各测1次粉尘浓度,每次测1升空气,分别测得39和25颗粉尘。请据此推断改革前后粉尘浓度是否相同(见数据文件data2.sav)? 变量说明:E:改革前后,1=改革前;2=改革后;N:粉尘数 ,PT:空气升数。 例5:某车间在生产工艺改革前测3次粉尘浓度,每次测1升空气,分别测得38,29和36颗粉尘;改革后测2次,分别由25和18颗粉尘。请据此推断改革前后粉尘浓度是否相同(见数据文件data3.sav)? 变量说明:E:改革前后,1=改革前;2=改革后;N:粉尘数 ,PT:空气升数。 例6:采用职业人群回顾性队列研究方法对所有1966年8月18日到1991年12月31日在湖北某厂工作5年以上者的生存情况作了调查。符合进入队列的条件者9572人,观察人年114488,其中有159人死亡,按年龄与是否暴露这两个因素分组的资料见下表,问年龄与暴露因素对死亡率有无影响? 变量说明:E:是否暴露,2=非暴露;1=暴露;age:年龄,5=40,4=40-49,3=50-59,2=60-69,1==70;N:死亡数 ,PT:人年。 先按照变量N进行加权,再进行Poisson回归 结论:暴露组相对于非暴露

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档