中山大医学统计学课件04数据处理.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据处理基础

牛晨光

第一临床学院

几个问题

1.研究结果的数据怎样记录?

2.数据出现异常值和缺失值怎么处理?

3.怎样把数据转换为统计软件可以分析的格式?

4.复杂关系的数据怎样去表示和管理?

5.平均率怎样计算?

6.什么是OR、RR?

课程内容

1.变量的测量尺度

2.数据准备

3.数据表操作

4.关系数据库设计(了解)

5.统计指标

变量的测量尺度

定比、定距、定序、定性

分类变量数值变量等级变量

完全缓解

部分缓解无缓解

无缓解

部分缓解

部分缓解

变量具有测量尺度

78.5433.5065.8386.26

69.46

88.08

169.0

142.0

170.0

181.0

158.5

181.0

变量名

资料

汉族

汉族

回族

汉族

彝族

汉族

A

B

A+B

B

A+B

A

1

2

3

4

5

735

72

81

90

72

70

71

身高(cm)

体重(Kg)

年龄(岁)

治疗方案

女…男

疗效

观测

编号

性别

民族

数据的测量尺度

基本尺度(CardinalScale)

。比例尺度(RatioScale),如身高值、体重值。

。距离尺度(IntervalScale),如体温值。

序列尺度(OrdinalScale),如临床分级、量表打分。

名义尺度(NominalScale),如姓名、性别。

/numbers/cardinal-ordinal-nominal.html

基本尺度数据(cardinalscaledata)

比例尺度数据(ratioscaledata)

距离尺度数据(intervalscaledata)

序列尺度数据(ordinalscaledata)

名义尺度数据(nominalscaledata)

可以使用某种尺度测出值的大小,两数间的差值有意义,可计算均值,一般有计量单位。

零点固定(意义明确),任何两个数据的比值是有意义的。

零点是任意的(意义不明确)。

可以比较大小,但是各个取值之间没有确切的间隔距离。通常的算数运算没有意义。

不同的数值代表的是类型,而类型是没有次序的。

数据(data)

测量尺度

类别区分(=,=)——频数/众数

次序区分(,)——序数/中值

距离区分(+,-)——合计/均值

比例区分(*,/)——零点/倍数

比例尺度—定比

(ratioscale)

间距尺度—定距

(intervalscale)

×

序列尺度—定序(ordinalscale)

×

×

名义尺度—定性

(nominalscale)

×

×

×

变量的类型

取值是具有基本尺度的数据——定量变量(scalevariable):

。也称尺度变量、测量变量、基本变量、数值变量等

。能够区别数据,并能计算各个取值的大小和差值。如身高、体重、体温。

取值是具有序列尺度的数据——定序变量(ordinalvariable):

。也称有序变量、有序分类变量、半定量变量、等级变量等

。取值能够区别个案等级次序,各个取值之间没有确切的间隔距离。如分级、评分。

取值是具有名义尺度的数据——定性变量(nominalvariable):

。也称分类变量、枚举变量、定类变量、名义变量等

。取值能够区别个案类别,各个取值之间不具有可比性且互斥。如性别、职业。

资料的类型

依据测量尺度,统计资料可分为如下类型:

计量资料(measurementdata),定量变量组成的资料

计数资料(countdata),定类变量组成的资料

等级资料(rankdata),定序资料,半定量资料,有序分类资料

因变量和自变量

在研究多个变量间的因果关系(y~x)时:

。设计为因的变量称为自变量(independentvariable),也称因素变量。在实验性研究中往往包括处理因素和混杂因素,其中混杂变量可被称为协变量。

。设计为果的变量称为因变量(dependentvariable),也称目标变量、依变量。在实验性研究中往往指效应变量。

举例:研究运动强度(高、中、低)与节食情况(有、无)对减肥效果的

影响,对得到的资料进行因果关系分析时:

。减肥效果为因变量;

。运动强度和节食情况为自变量,这是一个2因素研究,因素水平分别为3和2;

。如果做析因设计,这个研究就是一个2因素6(3×2)水平的研究。

多变量资料,也经常称为多元资料。

多变量资料的类型

您可能关注的文档

文档评论(0)

东华文库 + 关注
实名认证
服务提供商

中级会计、教师资格证持证人

专注于提供专业的文档服务,拥有海量各类优质、实用文档,尤其擅长精品课程资源开发。

领域认证该用户于2023年11月09日上传了中级会计、教师资格证

1亿VIP精品文档

相关文档