- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1讲医学统计学绪论review讲解
医学统计学 王 玖 博 士 卫生管理学院卫生统计学教研室 E-mail:mswj@163.com 第1讲 绪论 统计学(statistics) “a science dealing with the collection, analysis, interpretation and presentation of masses of numerical data” ---- Websters International Dictionary 统计学是收集、分析、解释与呈现数据资料的一门科学。 统计学的定义 统计学(statistics)是关于数据(data)的学问,是从数据中提取信息、知识的一门科学与艺术,包括研究设计、数据搜集、数据整理、数据分析和结果报告等步骤。 1.1 为什么要学习统计学? 英国统计学家Galton F(1822-1911)曾说过,当人类科学家在探索问题的丛林中遇到难以逾越的障碍时,惟有统计学工具可以为其开辟一条前进的道路。 1.2 生物医学数据的来源与类型 1.2.1 数据的来源 1.常规保存记录 2.实验记录 3.现场调查记录 4.其他数据 1.2.2 实例 图1-1 统计数据的变量类型 1.3 常用的基本概念 同质与变异 总体与样本 参数与统计量 误差 随机事件 概率与频率 同质与变异 同质(homogeneity):在调查研究或实验研究中,除了直接关注的研究因素外,其他非研究因素(如性别、年龄)也会影响研究结果,为了突出研究因素的作用,需要使各比较组之间的非研究因素尽可能相同. 变异(variation):即使非研究因素控制在相同条件下,个体的观察值之间也会有所不同(如双胞胎的性格、身高、体重等),这种在同质基础上个体之间的差异. 变异是统计学研究的基础,没有变异就无需统计学,统计学正是处理数据变异的科学。 总体与样本 总体(population):根据研究目的确定的、同质研究对象的全体。 总体可分为: 有限总体(finite population) 无限总体(infinite population)。 样本(sample):从总体中随机抽取的部分观察单位 参数与统计量 描述总体统计特征的指标称为参数。总体一旦确定下来,参数便是固定不变的常量,常用希腊字母表示,如均数、标准差、概率等的总体参数分别记为希腊字母 (读作mu)、 (读作sigma)、 (读作pi)。 描述样本统计特征的指标称为统计量(statistic) 统计量是通过样本获得的,个体的变异性使得从不同样本所得到的统计量会有所不同。常用英文字母表示。 误差 误差(error)泛指实测值与真实值之差,一般可分为随机误差和系统误差。 随机误差:受测量精确度(precision)限制,重复测量获得的实际测量值往往并不能稳定在同一值,而是无方向性地围绕某一个数值左右波动 。 系统误差(systematic error),也叫偏倚(bias)。是测量仪器或人为因素等导致的实际测量值与真实值之差 。 过失误差(gross error),在实验过程中由研究者偶然失误而造成。 图1-2 误差图示 随机事件 根据某一研究目的,在一定条件下对某一随机现象(不确定性现象)所进行的观察或试验称为随机试验(random trial)。 随机试验的结局事先是不确定的,称为随机事件(random event),简称事件(event),包括基本事件、必然事件和不可能事件。 概率与频率 事件发生的可能性大小称为概率(probability),一般用大写的P表示,取值在0到1之间。 必然事件的概率为 1, 一般随机事件的概率0 P 1, 不可能事件的概率为0。 当随机事件发生的概率P ≤ 0.05(5%)或P ≤ 0.01(1%)时,统计学上习惯地称之为小概率事件(small probability event)。 概率与频率 设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。 样本频率总是围绕总体概率随机地左右波动;样本含量n较大时,样本频率波动幅度较小,此时样本频率接近于总体概率。 1.4 统计工作贯穿医学研究的全过程 医学研究中的统计工作包括研究设计、数据搜集、数据整理、数据分析、结果报告和结论陈述等。 (1) 研究设计 在从事疾病调查、临床试验、实验室试验等研究工作之前,要事先作好研究设计(research design),事先对研究做出具体计划。 专业设计:选题、建立假说、
文档评论(0)