流行病学数据统计分析策略课件.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

流行病学数据统计分析策略中南大学湘雅公共卫生学院谭红专教授

主要内容概述nnn专题研究的数据分析常规收集的流行病学数据的分析2024/6/212

第一节概述流行病学研究与流行病学数据n流行病学数据分析的目的n流行病学数据中的变量分类n流行病学数据分析的内容n2024/6/213

一、流行病学研究与流行病学数据狭义的流行病学数据(epidemiologicalndata)指任何来自针对明确研究目的而开展特定流行病学研究所收集的资料。广义的流行病学数据还包括出于其他目n的和用途而收集的、可以用来定量地探索疾病健康或医疗卫生服务其他问题的资料。即一切可为流行病学所用的数据。目前的临床大数据是个宝库。n2024/6/214

二、流行病学数据分析的目的流行病学数据分析是针对明确研究问题、具有明确目的、采用特定方法对流行病学数据进行统计整理、统计描述、统计推断和总结。n流行病学研究的问题涉及疾病分布、病因与危险因素、诊断、预防和治疗效果评价等。n数据分析的根本是正确地回答有意义的问题,而不是统计学数字游戏。n2024/6/215

流行病学数据分析的目的估计有关统计学指标,如相对危险度;n估计该统计学指标的可信区间;n控制可能的混杂因素;n分析剂量反应关系;n分析可能的效应修饰因子;n分析可能存在的偏倚。n2024/6/216

三、流行病学数据中的变量分类典型的流行病学研究中变量可根据其用途分为五类:n暴露变量:因,自变量,可以有多个n结局变量:果,因变量,是数据分析的核心n混杂因素:需要控制n效应修饰因素:需要描述n其他变量:n2024/6/217

按统计学分类定性:二分类和多分类(无序多分类)nn定量:在多数流行病学研究中被转化为分类变量半定量(分级,有序多分类)nn同一个研究中,因变量和自变量的关系应该是固定的、不能互换。但在不同的研究中,一个变量在这个研究中可能是果,在另一个研究中也可能是因。例如,高血压可能是遗传的结果,血压也可能是心脑血管事件的原因。2024/6/218

四、流行病学数据分析的内容描述研究对象的数量变动;变量分类和数据整理;nn描述和比较组间基线资料;估计结局事件发生频率;nn估计效应大小及其可信区间;识别和控制混杂;nn识别和测量效应修饰作用;识别和测量剂量反应关系;其他分析。nnn2024/6/219

第二节流行病学专题研究的数据分析一、描述研究对象的数量变动数据分析的第一步须对研究对象数量随时间的变动进行描述,这是判断选择偏倚是否存在及其大小的主要依据;对选样、抽样和筛选都应交代原则和方法;对退出和失访都应记录数量和原因。2024/6/2110

2024/6/2111

二、流行病学变量的分类与数据转换转换目的:习惯、专业考量、模型限制n转换类型:定量转定性或分级,定性转定量n转换常用原则:借鉴既往同类研究的分n级方法;按照通用的分级标准,如年龄可按国际通用的婴儿、幼儿、青少年、青年、中年、老年的年龄切点来分级;把研究人群分成每组人数均等的3~5组等。2024/6/2112

三、描述基线资料基线资料就是有关研究对象代表性和混杂因素的信息资料。n基线资料描述的基本目的:一是交待研究对象n的特征,提供其代表人群的信息,据此判断结果的外推人群和外推性;二是评估暴露组和非暴露组之间混杂因素的可比性,检查存在混杂的可能性。描述基线资料时,通常在总体描述基础上,对暴露组和非暴露组还要分别进行描述。n2024/6/2113

四、结局事件发生的频率一般要求用率表示,如发病率。发病率由三个因素决定:观察时间、可能发病的总人数和实际发病人数。n一般情况下,发病率的分子是在一定时间内发病的总人数。nn分母则因研究设计不同而异。当发病率较低,且每个人的观察时间长短基本一致,可用研究开始时该组人数作分母计算发病率,叫做累积发病率(cumulativeincidence)。当结局事件发生率较高(如晚期癌症治疗试验中的死亡)或每个人的观察时间相差较大时,这时可用人时数(如人年数,person-years)做分母计算发病率,称作人时发病率(person-timeincidencerate或发病密度(incidencedensity),2024/6/2114

五、估计效应值效应就是暴露或治疗对结局作用或影响的大小,多用暴露组与非暴露组或治疗组与对照组间发病率的差别来表达。n2024/6/2115

2024/6/2116

六、估计效应可信区间由于随机误差,各效应指标的点估计不能代表效应的真实值,可信区间(ConfidencenInterval,CI)可用来表达由随机误差引起的效应估计值的不确定性。实践中一般采用95%可信区间,可以将其理解为真实效应值有95%的可能在这个区间之内。若效应指标的点估计值为X,标准误为SE,该效应指

您可能关注的文档

文档评论(0)

113541236359 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体成都谚晨心动科技文化有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510104MAD14BYH9L

1亿VIP精品文档

相关文档