生物医学数据的组织与表达.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物医学数据的组织与表达

第二章 生物医学数据的组织与表达 流行病学与卫生统计学系 宇传华 ; yuchua@163.com 本章的内容 第一节 数据与数据类型 一、原始数据的组织 二、变量的类型 三、定量变量的离散化与有序分类变量的数量化 第二节 频数分布表 一、定量数据的频数分布表 二、定性数据的频数分布表 三、配对设计定性数据的频数分布表 第三节 统计图形表达 第一节 数据与数据类型 一、原始数据的组织 每一行代表一个研究对象(单位)的观测记录 每一列代表一个观测指标(变量) Office Excel的界面 SPSS软件的数据界面 SAS软件的数据界面 表2.1数据的Excel输入格式 (原始记录) 表2.1数据的Excel输入格式 (字符数据的数值编码) 1、定性变量(Qualitative Variable) 也称为:计数数据(enumeration (counting) data) (1)名义变量(Nominal variable) 二项分类 性别分类,如男性为1,女性为0。 多项无序分类 血型的A、B、AB、O型多项无序分类 (2)有序(等级)变量(Ordinal or ranking variable) 多项有序分类 疗效观测分为显效、有效、好转及无效4个类别。 2、定量变量(Quantitative Variable) (1)区间变量(interval variable ) 或数值变量(numerical variable ) 如:身高,血压,血清胆固醇浓度,体温,脉搏计数、红细胞计数、玫瑰花环计数、住院天数等。 (一般有度量衡单位,类别间的差别大小有实际意义) (2)比变量(ratio variable) 以上例子中除体温外(具有真实意义的零点) 连续型变量(Continuous variable) 与 离散型变量(Discrete variables) 根据观察数据之间有无缝隙(gap),常将数据分类为离散型变量(有缝隙)与连续型变量(无缝隙)两大类,名义变量一定是离散型变量;连续型变量只能是比、区间和有序变量,但比、区间和有序变量也可以是离散型变量(见图) 三、定量变量的离散化 与有序分类变量的数量化 定量变量--?定性变量 第二节 频数分布表 一、定量数据的频数分布 二、(非配对设计)定性数据的频数分布 三、 配对设计定性数据的频数分布 一、定量数据的频数分布 频数表的编制步骤 (1)求极差(range): 即最大值与最小值之差,又称为全距。R=6.29-2.72=3.57 mmol/L (2) 决定分组组数、组距 根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距=极差/10, 再略加调整。3.57/10=0.357 ≈0.4 (3) 列出组段 第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。2.7~ 3.1~ …… 5.5~ 5.9~6.3 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。 二、(非配对设计)定性数据的频数分布 一维频数表 二维频数表 高维频数表 普通二维表的常见类型 三、配对设计定性数据的频数分布1 三、配对设计定性数据的频数分布2 第三节 统计图形表达 1、直方图(Histogram): 用于描述定量变量的数据分布特征。 2(1)、概率-概率散点图(p-p plot)又称为p-p图或百分点图,横轴为观察累积概率,纵轴为理论(如正态)累积概率,确定样本数据对于理论分布的一致性 2(2)、分位数-分位数散点图(q-q plot)又称为q-q图,横轴为观察值,纵轴为理论(如正态)分位数,确定样本数据对于理论分布的一致性 绘P-P或Q-Q图的数据 2、表2-4数据的茎叶(Stem-Leaf )图 3、盒式图(Box plot) 4、直条图(Bar chart):用直条反映定性变量不同类别下的某指标大小。 绘制直条图注意事项 5、饼图(pie Chart):反映定性变量各个分类的构成情况。 6. 散点图 7. 线图 (8)统计地图(statistical map) 小 结 1. 以行代表观察单位,列代表变量,以此方式组织的原始数据,不仅结构清晰,而且统计软件(SAS、SPSS)分析时无需更多变换。 2.变量的类型决定了统计分析方法。 按变量所能提供信息的大小,可将其分为定量变

文档评论(0)

wnqwwy20 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档