- 1、本文档共161页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 医学统计基本方法
第三章 医学统计基本方法
第一节 医学统计基本步骤
统计学是研究数据资料搜集、整理与分析、推断的科学,面对不确定性数据做出科学的推断,是认识社会和自然现象数量特征的重要工具。
(一)同质与变异
同质:是指观察单位(研究个体)间被研究指标的影响因素相同。
变异:由于生物个体的各种指标所受影响因素复杂,同质的个体间各种指标观察值不同,存在差异。同质基础上的各观察单位(亦称为个体)之间的差异为变异。
如同性别、同年龄、同民族、同地区儿童的身高有高有低,称为身高的变异。
(二)总体与样本
1.总体:是根据研究目的而确定的同质的个体之全部。(包括有限总体和无限总体)
2.样本:从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值
变量:对每个观察单位的某项特征进行测量和观察,这种被观察单位的特征称为变量。
变量值:对变量的测得值称为变量值
例如:肺活量为变量,测量的肺活量具体数据为变量值。
(三)参数与统计量
总体的统计指标被称为参数,如研究某年某地50岁以上的男子慢性支气管炎的患病情况,该地所有50岁以上男子慢性支气管的患病率即为总体参数。
样本的统计指标称为统计量,如用随机方法从该地抽取一部分50岁以上男子来调查其患病情况,计算的患病率即为统计量。
1.系统误差
由于人为因素造成。在收集资料的过程中,由于仪器设备、标准试剂、判定标准等不准确,使测定结果呈倾向性的偏大或偏小,这种误差称为系统误差。可直接影响原始资料的准确性,必须予以校正,尽可能避免。
2.随机测量误差
由于随机误差的形成取决于测定过程中一系列随机因素,这些随机因素是实验者无法严格控制的,因此,随机误差一般是不可避免的,分析工作者可以设法将它大大减小,控制在允许范围内,但不可能完全消除它。
3.抽样误差
由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。由于生物的个体变异是客观存在的,因而抽样误差是不可避免的,但抽样误差有一定的规律。
(四)误差
(五)概率
概率是描述随机事件发生的可能性大小的量值。常用符号P表示,范围在0与1之间。P≤0.05和P≤0.01分别表示事件发生的可能性等于或小于0.05和等于或小于0.01。
习惯上把P≤0.05或P≤0.01的事件称为小概率事件,表示某事件发生的可能性很小。
统计资料一般分为计量资料、计数资料与等级资料。不同类型的资料应用不同的分析方法。
(一)计量资料(数值变量资料或定量资料)
用定量方法测量每个观察单位的某项指标,所得的数值资料为计量资料。
如调查儿童生长发育状况时,以人为观察单位,每个人的身高(cm)、体重(kg)和血压(kPa)等数值为计量资料。
(二)分类资料
先将观察单位按某种属性或类别分组,然后清点各组的观察单位数所得的资料,其观察值是定性的。
1.无序分类资料:各类别之间有性质上不同,而无程度上差别-即计数资料包括二项分类、无序多项分类
2.有序分类资料:指将观察单位按某种属性的不同程度分成等级后分组,清点各组观察单位数所得的资料。即等级资料或半定量资料。
变量类型 变量值表现 举例
数值变量 定量(数值的大小) 血红蛋白
分类变量 定性(不相容的类别)
无序分类
二项 对立的两项 疗效:治愈、未愈
多项 不相容的多类 血型:A、B、O、AB
有序分类 类别间有程度差别 疗效:治愈、显效、好转、无效
如观察某人群成年女子的血红蛋白量(g/L)
若按血红蛋白正常与异常分为两类
若按血红蛋白量的多少分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高
数值变量
二项分类变量
有序分类变量
资料类型的划分是根据研究目的确定的,而统计分析方法的选用,则与资料类型密切相关。在资料的分析过程中,根据有关专业理论和实际需要,各类资料之间可以互相转
文档评论(0)