网站大量收购闲置独家精品文档,联系QQ:2885784924

统计学基础与EpiInfo的实现.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学基础与EpiInfo的实现.ppt

统计学基础与Epi Info的实现 中国CDC卫生统计研究室 陶庄 2009.8 在那个温暖的夏日午后… 女士品茶试验 试验:8杯奶茶,先加奶(MT),和先加茶(TM) 各半(比例告诉该女士),测试结果。 零假设:该女子没有分辨能力;即说对说错完全随机。 设x为说对的杯数 则x的取值只能为0,2,4,6,8。 取统计量T=x为猜对的杯数,T越大说明越能否定零假设。则x的概率分布为: 对可能结果的解释 什么是统计学? 统计学的定义 《大英百科全书》:“统计学是一门收集数据、分析数据, 并根据数据进行推断的科学和艺术。最初与政府收集的数据有关, 现在包括了范围广泛的方法和理论。” 《统计科学百科全书》:“统计学”这个术语表示“涉及收集、表示和分析数据的普遍方法和原理的领域”。 收集和分析的对象 “数据!数据!数据!”他不耐烦地叫嚷着,“没有黏土,我可做不出砖头。” ——歇洛克·福尔摩斯(铜山毛榉案) “Data! data! data!” he cried impatiently. “I can‘t make bricks without clay.”——Sherlock Holmes (The Adventure of the Copper Beeches) 两种数据 没有变异的数据——汇总分析和数值分析 有变异的数据——概率论与数理统计 统计学的定义 在终极的分析中,一切的知识都是历史;在抽象的基础上,一切的科学都是数学;在理性的意义下,所有的判断都是统计学。(C. R. Rao) 统计学是仅有的系统地研究推断的科学。(Efron) 研究规律的方法论 世界上有三种谎言:谎言,该死的谎言,统计数据。——Benjamin Disraeli There are three kinds of lies: lies, damned lies, and statistics. 统计学的两个性质 中立的工具:靠数据说话,而不是理论; 分析结果是“关系”,而不是“因果”。(Association is not causation.) 两种研究方案——实验与观察 对照实验不同于观察研究。 在一个对照试验中,是研究者决定谁将在处理组和谁将在对照组。 与此相反,在观察研究中,正是实验对象自己安排他们自己到不同的组去,而研究者只是观察所发生的情况。 两种研究方案——实验与观察 如果没有不可检验的假定的话,根据观察研究进行因果推断是不可能的。——Holland 你在那里所经历的不是一个实验,而是一种经验。——R. A. Fisher 几个基本概念 观察单位( observed unit) 总体(population)与样本(sample) 观测(observation)与变量(variable) 变量的类型 连续型变量(Continuous Variable)、定量资料(quantitative variable) 离散型变量(Discrete Variable)、分类变量(Categorical Variable )或称定性资料(qualitative variable) 二分类(binary variable) 离散计数(discrete quantity) 顺序(ordinal variable) 名义(nominal variable) 实例:凤凰城比马印第安人糖尿病的数据 共768个观测,9个变量: pregnant 怀孕次数(连续型) glucose 餐后血糖 (连续型) Diastolic 舒张压(连续型) Triceps 上臂围(连续型) insulin 胰岛素剂量(连续型) bmi 体质指数(连续型) Diabetes 糖尿病谱系指数(连续型) Age 年龄(连续型) test 糖尿病检测结果(离散型) 第一步:审视你的数据 描述性统计(descriptive statistics) 进来的是垃圾,出去的还是垃圾! (Garbage in, garbage out!) 连续型变量 集中趋势(central tendency) 均值(mean) 中位数(median) 众数(mode) 连续型变量 离散趋势(tendency of dispersion) 极差(range) 百分位数(percentile)、上下四分位数(QU,QL) 四分位间距(Inter-quartile range) 方差(variance)与标准差(standard deviation) 变异系数(coefficient of variation) 分类变量的数量化 分类变量的数量化 分类变量 相对数 率 构成比 Epi Info的实现 数据表:Analysis模块中的list,means,freque

文档评论(0)

wuyouwulu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档