- 1、本文档共83页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学基础与EpiInfo的实现.ppt
统计学基础与Epi Info的实现 中国CDC卫生统计研究室 陶庄 2009.8 在那个温暖的夏日午后… 女士品茶试验 试验:8杯奶茶,先加奶(MT),和先加茶(TM) 各半(比例告诉该女士),测试结果。 零假设:该女子没有分辨能力;即说对说错完全随机。 设x为说对的杯数 则x的取值只能为0,2,4,6,8。 取统计量T=x为猜对的杯数,T越大说明越能否定零假设。则x的概率分布为: 对可能结果的解释 什么是统计学? 统计学的定义 《大英百科全书》:“统计学是一门收集数据、分析数据, 并根据数据进行推断的科学和艺术。最初与政府收集的数据有关, 现在包括了范围广泛的方法和理论。” 《统计科学百科全书》:“统计学”这个术语表示“涉及收集、表示和分析数据的普遍方法和原理的领域”。 收集和分析的对象 “数据!数据!数据!”他不耐烦地叫嚷着,“没有黏土,我可做不出砖头。” ——歇洛克·福尔摩斯(铜山毛榉案) “Data! data! data!” he cried impatiently. “I can‘t make bricks without clay.”——Sherlock Holmes (The Adventure of the Copper Beeches) 两种数据 没有变异的数据——汇总分析和数值分析 有变异的数据——概率论与数理统计 统计学的定义 在终极的分析中,一切的知识都是历史;在抽象的基础上,一切的科学都是数学;在理性的意义下,所有的判断都是统计学。(C. R. Rao) 统计学是仅有的系统地研究推断的科学。(Efron) 研究规律的方法论 世界上有三种谎言:谎言,该死的谎言,统计数据。——Benjamin Disraeli There are three kinds of lies: lies, damned lies, and statistics. 统计学的两个性质 中立的工具:靠数据说话,而不是理论; 分析结果是“关系”,而不是“因果”。(Association is not causation.) 两种研究方案——实验与观察 对照实验不同于观察研究。 在一个对照试验中,是研究者决定谁将在处理组和谁将在对照组。 与此相反,在观察研究中,正是实验对象自己安排他们自己到不同的组去,而研究者只是观察所发生的情况。 两种研究方案——实验与观察 如果没有不可检验的假定的话,根据观察研究进行因果推断是不可能的。——Holland 你在那里所经历的不是一个实验,而是一种经验。——R. A. Fisher 几个基本概念 观察单位( observed unit) 总体(population)与样本(sample) 观测(observation)与变量(variable) 变量的类型 连续型变量(Continuous Variable)、定量资料(quantitative variable) 离散型变量(Discrete Variable)、分类变量(Categorical Variable )或称定性资料(qualitative variable) 二分类(binary variable) 离散计数(discrete quantity) 顺序(ordinal variable) 名义(nominal variable) 实例:凤凰城比马印第安人糖尿病的数据 共768个观测,9个变量: pregnant 怀孕次数(连续型) glucose 餐后血糖 (连续型) Diastolic 舒张压(连续型) Triceps 上臂围(连续型) insulin 胰岛素剂量(连续型) bmi 体质指数(连续型) Diabetes 糖尿病谱系指数(连续型) Age 年龄(连续型) test 糖尿病检测结果(离散型) 第一步:审视你的数据描述性统计(descriptive statistics) 进来的是垃圾,出去的还是垃圾! (Garbage in, garbage out!) 连续型变量 集中趋势(central tendency) 均值(mean) 中位数(median) 众数(mode) 连续型变量 离散趋势(tendency of dispersion) 极差(range) 百分位数(percentile)、上下四分位数(QU,QL) 四分位间距(Inter-quartile range) 方差(variance)与标准差(standard deviation) 变异系数(coefficient of variation) 分类变量的数量化 分类变量的数量化 分类变量 相对数 率 构成比 Epi Info的实现 数据表:Analysis模块中的list,means,freque
您可能关注的文档
- 精品小户型赠送面积分析.ppt
- 精品课件分娩生理.ppt
- 精神分裂症及其他精神病性障碍.ppt
- 精神分裂症及其治.ppt
- 精神分裂症的饮食禁忌.ppt
- 精细化施工操作手册.doc
- 糖尿病人的运动.ppt
- 糖尿病健康教育知识2011.04.25.ppt
- 糖尿病人的自我管理.ppt
- 糖尿病心脑血管疾病.ppt
- Fenton-Fe0还原-NaClO氧化处理粉浆废水的试验及模拟研究.docx
- 地方财政压力对企业技术创新的影响研究.docx
- 旋转射电暂现源J1854+0306的偏振辐射特征研究.docx
- 无钙焙烧铬渣中铁的资源化利用研究.docx
- 考虑流量和展示质量的电商平台运营策略和商家推广决策研究.docx
- SGLT2抑制剂卡格列净通过脂肪酸代谢SREBP1信号通路减轻高尿酸诱导的肾小管上皮细胞炎症与纤维化.docx
- 铁基材料耦合厌氧微生物强化水中磷回收过程与机制.docx
- Y2O3p-Mg-Zn-Gd-(Zr)复合材料热轧及退火组织、织构和力学性能.docx
- 基于Ca2+-CaMKK2-AMPK-mTOR信号通路介导的自噬探讨芪黄健脾滋肾颗粒治疗SLE伴血小板减少的机制研究.docx
- 吸烟和室内外空气污染对慢性阻塞性肺疾病及患者生活质量的影响研究.docx
文档评论(0)