定量资料统计描述和正态分布 PPT.pptVIP

  • 1
  • 0
  • 约2.38千字
  • 约 42页
  • 2021-04-14 发布于江西
  • 举报
三、方差与标准差 方差(variance):也称为均方差 (1)总体方差: (2)样本方差: 方差越大说明数据的变异越大 标准差(standard deviation) 方差是用取平方后的单位来表示的, 如果原始数据用毫米汞柱表示,则方差 就是毫米汞柱的平方。在统计分析中为了 方便,通常将方差取平方根,还原成与原 始观察值单位相同的变异量度。 计算公式 (1)总体标准差: (2)样本标准差: 直接法: 或 应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。 变异系数(coefficient of variation,简记为CV),又称为离散系数(coefficient of dispersion) 计算方法: 四、变异系数 应用: a.比较度量衡单位不同的多组资料的变异程度。 b. 比较均数相差悬殊的多组 资料 的变异程度(如舒张压和收缩压 ; 儿童身高与成人身高) 。 第四节 正态分布 某地正常成年男子红细胞数的分布情况 图3-2 图3-1 图2-1 正态分布 简记为N(μ,σ2) 1.正态分布的概率密度函数: 2.正态分布特点 正态分布密度函数曲线在横轴上方,以均数为中心左右对称,两端靠近X轴,但不与之相交。 正态分布曲线在横轴上方均数处最高。 正态分布有两个参数,即位置参数μ和变异参数σ 。 当σ固定后,μ增大,曲线沿横轴向右移动。μ减小,曲线沿横轴向左移动。 当μ固定后,σ越大,曲线的形状越“矮胖”,表示数据分布越分散;σ越小,曲线的形状越“瘦高”, 表示数据分布越集中。 定量资料统计描述和正态分布 第一节 频数分布 一、频数分布表 频数表:将分组标志和相应的频数列表,即为频数分布表,简称频数表。 认识频数表 下限(lower limit):每个组段的起点称为该组的下限。 上限(upper limit):每个组段的终点称为该组的上限。 频数分布图 直方图:适合描述连续型资料的频数分布。 三、频数分布表和频数分布图用途 1.描述频数分布类型: 对称分布:集中位置在中间。左右两侧频数基本对称。 偏态分布:右偏态分布和左偏态分布 2.描述频数分布的特征:集中趋势和离散趋势 3.便于发现资料中的特大或特小的离群值 4.便于进一步的分析和处理 第二节 集中趋势描述 集中趋势(平均水平) 大多数观察值所在的中心位置。 常用的有算术平均数、几何均数、中位数 一、算术均数 算术均数简称均数(mean),描述一组同质资料的平均水平。 总体均数: 样本均数: 2.频数表法:适用于样本量较大的计量资料。 计算方法 1. 直接计算法:适用于样本量较小的计量资料。 均数的应用: 均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。 极端值(outlier) 二、几何均数(geometric mean) 计算方法 1.直接法:适用于样本量较小的计量资料。 或 2.加权法:适用于样本量较大的计量资料,如频数表资料。 几何均数的应用注意事项 1)常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。 2)观察值中若有0或负值,则不宜直接使用几何均数。 3)观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。 三、中位数与百分位数 1.中位数(median):是将一组观察值按大小顺序排列后,位次居中的观察值。 当 为奇数时 当 为偶数时 2.百分位数(percentage): 是指将观察值从小到大排列后处于第x百分位置上的数值,是位置指标。 2.百分位数(percentage): 是指将观察值从小到大排列后处于第x百分位置上的数值,是位置指标。 中位数应用: 1.中位数可用于各种分布的资料。

文档评论(0)

1亿VIP精品文档

相关文档