02-统计描述(研20140921).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02-统计描述(研20140921)

⒈ 求全距(Range,简记R ):是一组资料中 最大值(Xmax)与最小值(Xmin)之差,亦称极差。 2. 定组距:将全距分为若干段,称为组段。 组与组之间的距离,称为组距;用小写i 表示。 3.写组段:即将全距分为若干段的过程。 4. 列表划记:根据预定的组段和组距,用划记的方法整理原始资料。 4. 样本含量足够大时,以频率作为概率的估计值。 离散程度大说明均数代表性差 离散程度小说明均数代表性好 对称分布资料的统计描述 (1)集中趋势的统计描述 —— 算术平均数 arithmetic mean ● 简称:均数(mean) ● 使用条件:数据分布比较均匀呈正态分布或近似正态分布。 ● 样本均数用符号: 表示 ● 总体均数用符号:μ表示 ● 计算方法有两种:直接法(小样本)和加权法(大样本) (2)离散趋势的统计学描述——标准差 方差: 分总体方差 ,样本方差 S2 ●计算: ●意义:克服了R值和Q 值的不足,考虑了每个变量值的离散情况并消除了N的影响。 ●优点:全面地考虑每个变量值的离散情况 ●缺点:其单位是原度量单位的平方。 标准差(Standard deviation,SD或S) 方差的单位是原度量单位的平方,不便使用。 标准差的计算公式得用(a-b)2原理展开: 非对称分布资料的统计描述 ● 概念:将原始观察值从小到大排序后,位次居中的那个数叫中位数,用M表示。 ● 使用条件:适用于任何分布的定量资料,特别是偏态分布、末端分布有特大特小值或无法确定、甚至分布不清的资料。 ● 表示符号:M ● 计算方法:直接法和加权法 P50 = M 1.某病患者9名,发病潜伏期分别为顺序 2、3、3、3、4、5、6、9、16d,求中位数。 1) 全距,或称极关(Range, 简称R) ● 计算:R=最大值-最小值= Xmax - Xmin ● 意义:反映观察值的全范围。 ● 条件:对各种分布类型资料都适用。 ● 优点:计算简单,方便使用。 ● 缺点:只利用最大值和最小值的信息,不能反映其它观察值的变异情况。 ● 建议:与其他离散指标共同使用。 全距和四分位数间距: 2)四分位数间距(Quartile, 简称Q) ●计算:Q=QU-QL=P75-P25 ●意义:中间一半观察值的极差。 ●条件:对各种分布类型的资料都适用,但常用于 偏峰分布资料。 ●优点:类似R值但比其稳定。 ●缺点:仍未考虑资料中每个观察值的变异度。 ●建议:与其他离散指标共同使用。 1)几何均数 geometric mean, G ● 概念:对一组观察值,先进行对数变换,按算术均数计算方法求其对数值的均数,该均数的反对数值即几何均数(G)。 ● 使用条件:用于原始数据分布呈偏态分布,等比资料(倍数变化)或对数正态分布资料的平均数的计算。 ● 表示符号:G ● 计算方法:直接法和加权法 1.有8份血清的抗体效价分别为: 1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640 求平均抗体效价。 1.有8份血清的抗体效价分别为: 1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640 求平均抗体效价。 2) 众数 mode, Mo ●概念:在一组观察值中,出现频率最高的那个值叫众数( mode, Mo )。 ● 使用条件:在对资料进行概略分析时,可用于表示一份资料的集中趋势。 ● 表示符号:Mo ● 计算方法:直接法和加权法 ● 特点:基于样本众数估计出的总体众数,应对应于概率密度函数的最高峰处。 3)调和均数 harmonic mean, H ●概念:是观察值倒数均数的倒数,可用于描述明显正偏峰分布资料的平均水平。 ●使用条件:正偏峰分布资料,如多种疾病的潜伏期、患者的住院天数、重金属元素在人体中的含量等资料。 ● 表示符号:H ● 计算方法:直接法和加权法 4) 全距,或称极差(Range, 简称R) ● 计算:R=最大值-最小值= Xmax - Xmin ● 意义:反映观察值的全范围。 ● 条件:对各种分布类型资料都适用。 ● 优点:计算简单,方便使用。 ● 缺点:只利用最大值和最小值的信息,不能反映其它观察值的变异情况。 ● 建议:与其他离散指标共同使用。 全距: 5)变异系数(coefficient of variation , CV) 意义:极差、标准差和四分位数间距都有单位的, 而变异系数是相对数,没有单位,用标准差与均数之

文档评论(0)

ccx55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档