1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.统计述

第三章 统计描述 statistical description 统计工作的步骤及内容 设计 收集资料 整理资料 分析资料 主要内容: 频数分布 数值变量的统计描述 正态分布及医学参考值范围 分类变量的统计描述 第一节 频数分布 统计描述的工作主要是在编制频数表的基础上描述资料的集中趋势和离散趋势。 频数(frequency):某变量值或指标值出现的次数。 频数表(frequency table) : 频数分布表的作用:对大样本计量资料进行整理,描述其分布特征,从而根据相应分布特征选用相应的统计描述和推断方法。 (应用条件:样本较大时) 频数表的编制步骤 1.确定组数 根据研究目的和样本含量n确定分组组数 原则:较好地显示数据分布规律 本例分为10组 2.确定组距 (1)等距 组距≈极差/组数,根据实际情况再作调整 极差(range):即最大值与最小值之差,又称为全 距,记为R 本例: R=84–57 =27(次/分) 组距:27/10=2.7 ≈3 (2)不等距 3.列出各组段上下限 频数分布包括整个资料范围的全部数据 第一组段的下限略小于最小值, 最后一个组段上限必须包含最大值 各组段上下限不交叉。 4.划记统计各组段频数 将所有数据归纳到各组段,得到各组段的频数、频率及累积频数、频率。 频数分布的特征及类型: 两个特征: 集中趋势(central tendency) 离散趋势(tendency of dispersion) 两种类型: 对称分布(symmetric distribution) 偏态分布(skewed distribution) 正偏态(positively skewed) 负偏态(negatively skewed) 频数表的主要用途 (1)描述资料的分布特征和分布类型。 (2)进一步计算有关指标或进行统计分析。 (3)发现特大、特小的可疑值。 (4)样本含量较大时,可将频率作为概率估计值。 (5)据此绘制频数分布图。 便于发现一些特大或特小的可疑值 频数分布图 以直方的面积大小表示频数的多少,以直方面积在总面积中的比例表示频率大小。其用途与频数表类似,但它比频数表更直观、更形象。 频数分布图 频数分布的类型 第二节 数值变量的统计描述 一、集中趋势描述 统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。 常用的平均数有: 算术均数 几何均数 G 中位数 M 1.算术平均数(arithmetic mean) 均数(mean):一组性质相同的观察值在数量上的平均水平。 ?(总体) (样本) 计算: 直接法 加权法 适用条件:对称分布特别是正态分布或近似正态分布 例:有9名健康成人的空腹胆固醇测定值(mmol/L)为5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93,求算术均数。 2.几何平均数(geometric mean) 几何均数:N个数值的乘积开N次方即为这N个数的几何均数。 G 计算:直接计算法 加权法 适用条件:等比资料、对数正态分布。 例如抗体滴度。 注意:观察值不能为0 、不能同时有正有负 同一资料算得的几何均数小于算术均数 例:某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为:10,20,40,40,160,求几何均数。 例:69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。 故本例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为1:150.6。 3.中位数和百分位数(median and percentile) 中位数:将一组观察值从小到大排序后,位置居中的那个变量值(n为奇数)或位置居中的两个变量值的均值(n为偶数)。M 百分位数:将一组观察值从小到大排序,分成100等份,各等份含1%的观察值,分割界限上的数值即为第X百分位数,是一个界值。PX 常用的百分位数:P5 P25 P75 P95 中位数是位次上的平均指标,是百分位数的特殊形式 适用于各种分布类型的资料,特别是: 资料明显偏态 资料一端或两端无确定数值(开口资料) 资料分布情况不明

文档评论(0)

yan666888 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档