- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据处理基础
牛晨光
第一临床学院
几个问题
1.研究结果的数据怎样记录?
2.数据出现异常值和缺失值怎么处理?
3.怎样把数据转换为统计软件可以分析的格式?
4.复杂关系的数据怎样去表示和管理?
5.平均率怎样计算?
6.什么是OR、RR?
课程内容
1.变量的测量尺度
2.数据准备
3.数据表操作
4.关系数据库设计(了解)
5.统计指标
变量的测量尺度
定比、定距、定序、定性
分类变量数值变量等级变量
完全缓解
部分缓解无缓解
无缓解
部分缓解
…
部分缓解
变量具有测量尺度
78.5433.5065.8386.26
69.46
…
88.08
169.0
142.0
170.0
181.0
158.5
…
181.0
变量名
资料
汉族
汉族
回族
汉族
彝族
…
汉族
A
B
A+B
B
A+B
…
A
1
2
3
4
5
…
735
72
81
90
72
70
…
71
身高(cm)
体重(Kg)
年龄(岁)
治疗方案
女…男
男
男
疗效
观测
编号
性别
民族
女
男
数据的测量尺度
基本尺度(CardinalScale)
。比例尺度(RatioScale),如身高值、体重值。
。距离尺度(IntervalScale),如体温值。
序列尺度(OrdinalScale),如临床分级、量表打分。
名义尺度(NominalScale),如姓名、性别。
/numbers/cardinal-ordinal-nominal.html
基本尺度数据(cardinalscaledata)
比例尺度数据(ratioscaledata)
距离尺度数据(intervalscaledata)
序列尺度数据(ordinalscaledata)
名义尺度数据(nominalscaledata)
可以使用某种尺度测出值的大小,两数间的差值有意义,可计算均值,一般有计量单位。
零点固定(意义明确),任何两个数据的比值是有意义的。
零点是任意的(意义不明确)。
可以比较大小,但是各个取值之间没有确切的间隔距离。通常的算数运算没有意义。
不同的数值代表的是类型,而类型是没有次序的。
数据(data)
测量尺度
类别区分(=,=)——频数/众数
次序区分(,)——序数/中值
距离区分(+,-)——合计/均值
比例区分(*,/)——零点/倍数
比例尺度—定比
(ratioscale)
√
√
√
√
间距尺度—定距
(intervalscale)
√
√
√
×
序列尺度—定序(ordinalscale)
√
√
×
×
名义尺度—定性
(nominalscale)
√
×
×
×
变量的类型
取值是具有基本尺度的数据——定量变量(scalevariable):
。也称尺度变量、测量变量、基本变量、数值变量等
。能够区别数据,并能计算各个取值的大小和差值。如身高、体重、体温。
取值是具有序列尺度的数据——定序变量(ordinalvariable):
。也称有序变量、有序分类变量、半定量变量、等级变量等
。取值能够区别个案等级次序,各个取值之间没有确切的间隔距离。如分级、评分。
取值是具有名义尺度的数据——定性变量(nominalvariable):
。也称分类变量、枚举变量、定类变量、名义变量等
。取值能够区别个案类别,各个取值之间不具有可比性且互斥。如性别、职业。
资料的类型
依据测量尺度,统计资料可分为如下类型:
计量资料(measurementdata),定量变量组成的资料
计数资料(countdata),定类变量组成的资料
等级资料(rankdata),定序资料,半定量资料,有序分类资料
因变量和自变量
在研究多个变量间的因果关系(y~x)时:
。设计为因的变量称为自变量(independentvariable),也称因素变量。在实验性研究中往往包括处理因素和混杂因素,其中混杂变量可被称为协变量。
。设计为果的变量称为因变量(dependentvariable),也称目标变量、依变量。在实验性研究中往往指效应变量。
举例:研究运动强度(高、中、低)与节食情况(有、无)对减肥效果的
影响,对得到的资料进行因果关系分析时:
。减肥效果为因变量;
。运动强度和节食情况为自变量,这是一个2因素研究,因素水平分别为3和2;
。如果做析因设计,这个研究就是一个2因素6(3×2)水平的研究。
多变量资料,也经常称为多元资料。
多变量资料的类型
您可能关注的文档
- 郑大生物医学研究统计方法课件08定性资料的比较.pptx
- 郑大生物医学研究统计方法课件10简单线性回归分析.pptx
- 郑大生物医学研究统计方法课件12实验设计.pptx
- 郑大生物医学研究统计方法课件20总复习.pptx
- 郑大生物医学研究统计方法课件第2章 统计描述.pdf
- 郑大生物医学研究统计方法课件第3章 正态分布.pdf
- 郑大生物医学研究统计方法课件第3章 正态分布.pptx
- 郑大生物医学研究统计方法课件第4章 参数估计.pptx
- 郑大生物医学研究统计方法课件第6章 两样本定量资料比较修改.pptx
- 郑大生物医学研究统计方法课件第7章 方差分析.pptx
- 《2025年养老社区适老化无障碍设施建设人才培养策略》.docx
- 《2025年新能源车环保内饰材料抗过敏与健康安全标准》.docx
- 《2025年充电桩网络发展:城际快充站运营成本控制与收益模式》.docx
- 2026国家管网集团高校毕业生招聘笔试模拟试题(浓缩500题)附参考答案详解(轻巧夺冠).docx
- 《2025年老年护理培训与护工收入水平提升研究》.docx
- 2025年检测机器人行业创新技术及市场应用报告.docx
- 2025年柬埔寨语培训机构教学品牌创新塑造报告.docx
- 2026国家管网集团高校毕业生招聘笔试模拟试题(浓缩500题)附参考答案详解(轻巧夺冠).docx
- 《2025年家用血氧仪产品差异化与健康管理设备行业趋势》.docx
- 2025年婚庆服务行业高端市场拓展策略研究报告.docx
最近下载
- 北斗卫星导航定位系统总结.doc VIP
- 如何制作标书22).pptx VIP
- 卧式单面多轴钻孔组合机床动力滑台的液压系统设计.doc VIP
- (高清版)DB32∕T 4659.2-2024 医院公共卫生工作规范 第2部分:疾控机构医防融合工作指南.pdf VIP
- 2025年中考语文作文猜押:《有一束光照亮我的世界》写作技巧课件.pptx VIP
- (高清版)DG∕TJ 08-2435-2023 市域铁路设计标准.pdf VIP
- Landmark钻井设计软件课件.pptx VIP
- 常见安全生产隐患辨识图册.pptx VIP
- 兰德马克(Landmark)钻井设计软件组成.pptx VIP
- 工程质量风险分级管控清单 .pdf VIP
原创力文档


文档评论(0)