网站大量收购独家精品文档,联系QQ:2885784924

数值变量资料的统计描述 知识介绍.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数值变量资料的统计描述 知识介绍.ppt

例8.1 试分别求例8.1频数表的第25、第75百分位数。 P25=4.20+0.20x[(132x25%-14)/23]=4.365 P75=4.80+0.20x[(132x75%-86)/20]=4.930 血糖(mol/L)组段 组中值(xi) 频数(f) 累计频数(Σf) 频率(%) 累计频率(%) 3.60~ 3.70 3 3 2.27 2.27 3.80~ 3.90 3 6 2.27 4.55 4.00~ 4.10 8 14 6.06 10.61 4.20~ 4.30 23 37 17.42 28.03 4.40~ 4.50 24 61 18.18 46.21 4.60~ 4.70 25 86 18.94 65.15 4.80~ 4.90 20 106 15.15 80.30 5.00~ 5.10 12 118 9.09 89.39 5.20~ 5.30 10 128 7.58 96.97 5.40~5.60 5.50 4 132 3.03 100.00 合计 132(Σfi) 100.00 三种平均数的特点 算术均数:通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不稳定而失去代表性。?正态分布 几何均数一般只适宜于等比级数资料。对于这类资料,用几何均数反映集中趋势比算术均数或中位数更合适。 中位数不受其前后其他数值(特别是极端值)的影响。但如果数据呈明显不同且差异很大,这时中位数可能不适宜作为集中趋势的度量值了。?偏态分布 反映集中趋势的指标(平均数),表示一组观察值的平均水及集中特性,并可作为总体的一个代表值加以应用。但是它没有表达其所代表的总体中各个个体之间的差异。 统计学中把个体间的差异称为变异性(variation)。所谓变异性是指在同质条件下的观察单位,其同一标志的数据间的差异性。用以描述一组数值变量资料观察值之间参差不齐的程度,即离散程度或变异度的指标,称为离散指标或变异指标。 第三节 离散趋势的描述 盘编号  甲 乙 丙 1 560 520 510 2 540 510 505 3 500 500 500 4 460 490 495 5 440 480 490 合计 2500 2500 2500 均数 500 500 500 例:设甲、乙、丙三人,采每人的耳垂血,然后作红细胞计数,每人数5个计数盘,得结果如下(万/mm3) 甲 乙 丙 常用统计指标 全距(range) 四分位数间距(quartile interval) 方差和标准差(variancestandard deviation) 变异系数(CV coefficient of variation) 全距,用R表示:即一组变量值最大值与最小值之差,亦称极差。对于书中例8.1数据,有 简单,但仅利用了两端点值,稳定性差。 一、全距(Range) R=5.59–3.60 =1.99(mol/L) R越大,变异度越大;R越小,变异度越小。 二、四分位数间距(quartile range) 四分位数间距,用Q表示,若将一组资料分为四等份,上四分位数和下四分位数之差就是Q: Q= 下四分位数: 上四分位数: 比全距稳定;可用于一端或两端无确切数值的偏态资料。 未考虑每一个观察值。 全距和四分位数间距都未全面考虑观察值的变异情况,为了克服该缺点,需计算总体中每个观察值x与总体均数?的差值(x-?),称为离均差。 由于∑(x-?)=0,不能反映变异的大小,而用离均差平方和 ∑(x-?)2(sum of deviation from mean)反映。同时还要考虑到观察值个数N的影响,用其均数,即得到总体的方差,用?2表示。 公式为: 三、方差与标准差 1. 方差(variance)是离均差平方和的均数,反映一 组数据的平均离散水平。 由于在实际工作中,往往得到的样本资料,总体均数?是未知的,所以只能用样本均数 作为?的估计值,即用 代替 ,用样本例数n代替N。但按公式计算的结果通常比实际的 低。所以用n-1来代替n进行校正。得到样本方差 离均差平方和SS 总体方差 样本方差 自由度 2.标准差(standard deviation) 方差可以比较全面地反映变量值的变异情况,但其方差的单位是原单位的平方,故引入标准差的概念。 标准差:将方差开平方,恢复成原度量单位,得到总体的标准差? 和样本标准差S。 样本标准差用 表示 ,

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档