- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二、计量资料的统计描述
计量资料的统计描述 董 英 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第一节 频数分布 一、频数分布表(frequency table) 列出观察指标的可能取值区间,及在各区间出现的频数; 可较好地体现观察值的分布规律。 频数表的编制步骤 1.确定组数 研究目的和样本含量n确定分组组数 原则:较好地显示数据分布规律 本例分为10组 频数表的编制步骤 2.确定组距 (1)等距 组距≈极差/组数,根据实际情况再作调整 极差(range):即最大值与最小值之差,又称为全 距,记为R 本例: R=84 – 57 =27(次/分) 组距:27/10=2.7 ≈3 (2)不等距 频数表的编制步骤 3.列出各组段上下限 频数分布包括整个资料范围的全部数据 第一组段的下限略小于最小值, 最后一个组段上限必须包含最大值 各组段上下限不交叉。 4.划记统计各组段频数 将所有数据归纳到各组段,得到各组段的频数、频率及累积频数、频率。 二、频数分布图 三、频数表和频数分布图用途 1.描述频数分布的类型:对称分布、偏态分布 (1)对称分布 :各组段的频数以频数最多组段为中心,左右两侧大致对称,如下图所示: (2)偏态分布 :正偏态、负偏态分布 1)正偏态分布(右偏态分布):高峰位于左侧,右侧的组段数多于左侧的组段数,频数向右侧拖尾。 2)负偏态分布(左偏态分布): 高峰位于右侧, 左侧的组段数多于右侧的组段数,频数向左侧拖尾。 2.描述频数分布的特征:集中趋势和离散趋势 表2-1数据的频数分布特征: (1)集中趋势:数据高低不等,但向中间集中,集中的组段在68~73(次/分)之间,尤以组段71~(次/分)的人数最多。且上下组段的频数分布基本对称。 (2)离散趋势:随着脉搏逐渐变大或变小,人数越来越少,即向两端分散。 3.便于发现一些特大或特小的可疑值 第二节 集中趋势的描述 平均数(average)是一类指标,用来描述数值变量资料的集中趋势(或平均水平),简明概括,便于比较。 常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median) 一、算术均数 算术均数:简称均数(mean) 总体均数μ,样本均数 适用于对称分布特别是正态分布资料,位于分布的中心,是频数分布最集中的位置 多数正常生理、生化指标都适宜用均数表达集中趋势。 计算方法 (一)直接计算法 公式 : (二)加权法(利用频数表): 公式 : 二、 几何均数(geometric mean) 适用条件: 原始数据分布不对称,数值按大小顺序排列后观察值间按倍数关系变化,经对数转换后呈对称分布的资料。如医学上的滴度资料。 例如: 抗体滴度、血清学凝集效价等。 (一)直接法: 例2-5 有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。 例2-6 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。 三、??中位数与百分位数 11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60 平均存活天数? (一)中位数(median) 是将一组变量值从小到大排列,位置居于中间的那个变量值(n为奇)或位置居中的两个变量值的均数(n为偶) 中位数应用情况 适用于各种分布类型的资料,特别是: 资料明显偏态 资料一端或两端无确定数值(开口资料) 资料分布情况不明 中位数计算方法 1.直接计算公式: n为奇数时 n为偶数时 例2-3 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,求其中位数。 例2-1频数表中位数的计算 1.直接计算法 设有n个原始数据从小到大排列,第X百 分位数的计算公式为: 当 为带有小数位时: 当 为整数时: 例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 患 者: 住院天数: (1)n=120,
文档评论(0)