- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学思路.doc
* 变量 (variable)
在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量。如“身高”、“体重”、“疗效”、“性别”、“职业” 等都是变量。变量的观察结果或测量值称为变量值,变量按其值的性质可分为数值变量(numerical variable)和分类变量(categorical variable)。
数值变量的变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。如身高(cm)、体重(kg)、心律(次/分)、住院天数(日)、血压(mmHg)等。由数值变量的测量值组成的资料称为数值变量资料(计量资料或定量资料)。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只是正整数。如心率、白细胞计数等,在医学统计学中把它们也视为连续型变量。
分类变量表现为互不相容的类别或属性,亦称定性变量。分类变量又可分为无序与有序两类。
1、无序分类变量是所分类别或属性之间无程度和顺序上的差别。如性别(男、女);血型(O、A、B、AB)等。无序分类变量的分析应先按类别分组,然后清点各组的观察单位数,编制分类资料的频数表,所得资料为无序分类变量资料(计数资料或定性资料)。它又有二项分类资料和多项分类资料之分。
1)二项分类资料:仅有两种类别或属性。如性别(男、女),化验结果(阴、阳性)等。
2)多项分类资料:两种以上的类别或属性。如血型(O、A、B、AB),职业(工人、农民、商人、干部、军人、教师 …)等。
2、有序分类变量是各类别或属性之间有程度上的差别。如尿糖化验结果按 (、(、+、++、+++分类;疗效按治愈、好转、无效、恶化分组。有序分类变量的分析应先按等级顺序分组,然后清点各组的观察单位数,编制各等级的频数表,所得资料为有序分类变量资料(等级资料)。
除以上资料外,医学研究中还有角度(如脑电图)、季节月份、时间等周而复始的资料,在医学统计中称其为圆形分布资料。
另外,变量类型不是一成不变的,可根据研究分析的需要进行转化。例如白细胞计数原属数值变量,若按正常、异常分组,则为无序分类变量;若按过低(4000)、正常(4000~10000)、过高(10000)分组,则为有序分类变量。分类变量也可数量化,如将病人的恶心反应以0、1、2、3表示。
在做统计分析时,无论是统计描述,还是统计推断,都要先考虑变量类型,变量类型不同统计方法也各异。
※ 统计学的分析思路
资料的分析必须包括两部分内容:一是统计描述,二是统计推断。分析资料时,无论何种研究目的,首先要对样本资料进行统计描述,然后根据研究目的进行统计推断。
一、统计描述
根据资料的变量类型及其分布特征选用恰当的描述性指标和统计图(表)来描述样本特征。
* 常见的变量类型有:数值变量资料和分类变量资料(前文提过)。
1、数值变量资料
根据变量值的频数分布,数值变量资料有正态分布、对数正态分布和偏态分布之分。
数值变量资料的描述 分布类型 描述性指标 正态分布 ※ 均数 和标准差 ;(必要时,可用 、 和 ) 对数正态分布※ 几何均数 和相应的标准差 偏态分布 中位数 和四分位数间距 ※正态分布含近似正态分布; 对数正态分布含倍数资料(以下同)
表中相应的公式: 、 ;
、 ;
、 ,其中
2、分类变量资料
应用相对数来描述。常用的相对数有率、构成比和相对比,可根据不同的研究目的选用。
率为频率指标,用于说明某现象发生的频率或强度。其公式为 ;
构成比为构成指标,用于说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。其公式为:
相对比是A、B两个有关指标之比,用于说明A为B的若干倍或百分之几。A、B两个指标可以是性质相同的,也可以是性质不同的;可以是绝对数,也可以是相对数或绝对数。其公式为:
二、统计推断
抽样研究的目的是用样本信息来推断总体特征,即统计推断。统计推断又包括总体参数估计和假设检验两部分内容。进行统计推断时,需根据研究目的、设计类型、资料类型及其分布特征,正确选用分析方法。
* 常见的研究目的:估计总体参数、制定医学参考值范围、假设检验(样本与总体的比较、两样本的比较、多样本的比较)、多因素分析(含线性相关回归)等。
* 常见的设计类型:完全随机设计、配对设计、随机区组设计(配伍组设计);其次,还有交叉设计、拉丁方设计、析因设计、正交设计等。
* 常见的资料类型及其分布特征:数值变量资料(正态、对数正态、偏态分布)、分类变量资料(二项分布、Poisson分布)
(一)估计总体参数:(均按完全随机抽样方法获得的
您可能关注的文档
最近下载
- 电动叉车安全风险点告知牌.docx VIP
- AQL抽样标准培训.pptx VIP
- 2025广东中山市东凤镇污水处理有限责任公司管网维护人员招聘6人笔试模拟试题及答案解析.docx VIP
- 家具设计与工艺ppt-板式家具结构与生产工艺.pdf VIP
- 2025河北建材职业技术学院招聘106人笔试参考题库附答案解析.docx VIP
- 部编版语文四年级下册第四单元大单元教学设计核心素养目标.pdf VIP
- 初中数学常用二级结论知识点总结.doc VIP
- 我的师德小故事 .docx VIP
- 主要股东或出资人信息及投标人基本情况表模板.docx VIP
- 新型独脚金内酯类似物的结构设计、合成及对水稻生长调控的多维度探究.docx
文档评论(0)