第1-2章 绪论及定量资料描述.ppt

第1-2章 绪论及定量资料描述.ppt

卫生统计学 方积乾 中山大学公共卫生学院 医学统计与流行病学系 卫生统计学 第一章 绪论 什么是统计学(statistics)? “A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data” (Websters International Dictionary)。 “The science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results” (John M. Last, A Dictionary of Epidemiology) 什么是统计学(statistics)? 内容:收集、分析、解释和表达数据 统计学:处理数据中变异性的科学与艺术 目的:求得可靠的结果 统计学的现实地位:合作、审稿、基金申请(NIH)、药物开发与申报(FDA)、卫生决策 ?? 统计学的若干概念 1. 总体与样本 总体(population): 大同小异的对象全体。 目标总体(target population): 试图下结论的某个总体. 例如,英国成年男子为目标总体 研究总体(study population) : 资料来源的较小的总体. 例如,1951年英国全部注册医生 需要谨慎: 就研究总体所下的结论未必适用于目标总体。 抽样(sampling):从研究总体抽取部分个体 样本(sample):抽取的部分个体 数据(data):观察所得资料 推断(inference) :分析样本数据,获得关于总体的知识 数据?信息 信息?知识 统计推断的工具:有关概率的理论。 推断的结论从来不是完全肯定或完全否定的。 关键与核心:抽样方法、样本的代表性和推断的方法 2.同质与变异 同质性(homogeneity)  共性,大同小异 变异(variation) 个体间差异,多样性 没有同质性就构不成一个总体; 总体内没有变异性就无需统计学。 统计学的任务: 在变异的背景上 描述同一总体的同质性, 揭示不同总体的异质性 (heterogeneity)。 3. 变量的类型 变量(variable):个体特性的数量描述 (1) 定性变量 (i) 分类变量(categorical variable) 或 名义变量(nominative variable)。 分类变量的水平(level) 代码(code) 用1、2、3、4、5等来表示各个水平。 二分类变量(binary variable), 也称0-1变量或假变量(dummy variable) (ii) 有序变量(ordinal variable) 种种可能的“取值”中自然地存在着次序。 (2)定量变量 (i) 离散型变量 只能取整数值。 例如,手术病人数; 新生儿数 (ii) 连续型变量 可以取实数轴上的任何数值。 由测量而得到的大多属于连续型变量 例如,血压、身高、体重等 “连续”: 指该变量可以在实数轴上连续变动。 变通:红细胞记数也视为连续型变量。 (一个、两个、三个之间的差别并不重要) 变量类型的转化: 只能由高级向低级转化, 不能作相反方向的转化 连续型→有序→分类→二值 离散型变量常常通过适当的变换或连续性校正 后借用连续型变量或有序变量的方法来分析。 4. 因果与联系 公共卫生领域常常要探究危险因素与疾病 之间的因果关系(causation)。 首先应当问存在不存在联系 (association) 然而,存在联系未必有因果关系 在解释统计分析的结果以及下结论时, 务必对“因果”二字慎之又慎。 学习目的与方法 (1)统计思维享用一生 事件的不确定性 ---- 概率 由样本推断总体,结论的不确定性 ---- 有 可能犯错误 统计学任务 ---- 限定犯错误概率的大小,

文档评论(0)

1亿VIP精品文档

相关文档