- 1、本文档共100页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
方积乾(统计基础)【荐】.ppt
卫生统计学 方积乾 中山大学公共卫生学院 医学统计与流行病学系 卫生统计学 第一章 绪论 什么是统计学(statistics)? “A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data” (Websters International Dictionary)。 “The science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results” (John M. Last, A Dictionary of Epidemiology) 什么是统计学(statistics)? 内容:收集、分析、解释和表达数据 统计学:处理数据中变异性的科学与艺术 目的:求得可靠的结果 统计学的现实地位:合作、审稿、基金申请(NIH)、药物开发与申报(FDA)、卫生决策 ?? 统计学的若干概念 1. 总体与样本 总体(population): 大同小异的对象全体。 目标总体(target population): 试图下结论的某个总体. 例如,英国成年男子为目标总体 研究总体(study population) : 资料来源的较小的总体. 例如,1951年英国全部注册医生 需要谨慎: 就研究总体所下的结论未必适用于目标总体。 抽样(sampling):从研究总体抽取部分个体 样本(sample):抽取的部分个体 数据(data):观察所得资料 推断(inference) :分析样本数据,获得关于总体的知识 数据?信息 信息?知识 统计推断的工具:有关概率的理论。 推断的结论从来不是完全肯定或完全否定的。 关键与核心:抽样方法、样本的代表性和推断的方法 2.同质与变异 同质性(homogeneity) 共性,大同小异 变异(variation) 个体间差异,多样性 没有同质性就构不成一个总体; 总体内没有变异性就无需统计学。 统计学的任务: 在变异的背景上 描述同一总体的同质性, 揭示不同总体的异质性 (heterogeneity)。 3. 变量的类型 变量(variable):个体特性的数量描述 (1) 定性变量 (i) 分类变量(categorical variable) 或 名义变量(nominative variable)。 分类变量的水平(level) 代码(code) 用1、2、3、4、5等来表示各个水平。 二分类变量(binary variable), 也称0-1变量或假变量(dummy variable) (ii) 有序变量(ordinal variable) 种种可能的“取值”中自然地存在着次序。 (2)定量变量 (i) 离散型变量 只能取整数值。 例如,手术病人数; 新生儿数 (ii) 连续型变量 可以取实数轴上的任何数值。 由测量而得到的大多属于连续型变量 例如,血压、身高、体重等 “连续”: 指该变量可以在实数轴上连续变动。 变通:红细胞记数也视为连续型变量。 (一个、两个、三个之间的差别并不重要) 变量类型的转化: 只能由高级向低级转化, 不能作相反方向的转化 连续型→有序→分类→二值 离散型变量常常通过适当的变换或连续性校正 后借用连续型变量或有序变量的方法来分析。 4. 因果与联系 公共卫生领域常常要探究危险因素与疾病 之间的因果关系(causation)。 首先应当问存在不存在联系 (association) 然而,存在联系未必有因果关系 在解释统计分析的结果以及下结论时, 务必对“因果”二字慎之又慎。 第二章 定量资料的统计描述 把握资料的基本特征 为统计分析打下基础 统计表 描述性统计量 统计图 第一节 频数与频数分布 频数分布表(frequency distribution table),又称频数表 ? 一、?? 离散型定量变量的频数分布 例2-1 1998年某山区96名孕妇产
文档评论(0)