离散程度、正态分布.pptVIP

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
离散趋势的描述 吴立娟 流行病与卫生统计学系 阶平楼230 对以下三组数据特征进行分析 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34 定量描述离散趋势的指标,称为变异指标。反映一组同质的计量资料观察值之间变异程度。 指标 按间距计算:全距和四分位间距 按平均差距计算:离均差平方和、方差、 标准差、变异系数 一、全距(range) 二、四分位数间距 分位数 介于最大值和最小值之间的一个数值,它使得变量的一部分观察值小于或等于它,另一部分观察值大于或等于它。 百分位数 是一个位置指标,用Xp%表示。 对样本来说,它表示按照升序排列的数列中,其左侧(即小于Xp%侧)的观察个数在整个样本中所占的百分比为p%,其右侧(即大于Xp%侧)的观察个数在整个样本中所占的百分比为(100-p)%。 四分位数间距(inter-quartile range) 将特殊的3个分位数X25%, X50%, X75%统称为四分位数,并且分别称为第一四分位数,第二四分位数和第三四分位数,记为Q1,Q2和Q3. Q3与Q1的差值为四分位间距。 四分位数间距常用于描述偏态分布资料,两端无确切值或分布不明确资料的离散程度 四分位数间距较全距稳定,常与中位数一起,描述偏态分布资料的特征。 计量单位与原变量的计量单位相同,且它对离群值的敏感远远低于全距,受样本量的影响较小。 缺点是仅使用了原变量的部分信息。 三、离均差平方和 平均偏差:为了利用每一个观察值的信息,一个自然的设想是计算各观察值偏离平均数的平均差距,为了避免正负抵消,可将每个观察值与均数之差的绝对值相加,然后取平均,称作平均偏差。 离均差平方和(sum of square, ss) 四、方差(mean of square,MS) 样本均数代替总体均数,导致离均差缩小;英国统计学家Gosset W-S 提出自由度,以n-1代替n。 n-1又称作自由度(degrees of freedom),指随机变量可以“自由”变动的个数。 υ=n-限制条件的数目 五、标准差(standard of deviation, SD) 标准差的基本内容是 “离均差”,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。 R SS MS S 甲组 8 40 10.0 3.16 乙组 12 90 22.5 4.74 丙组 8 34 8.5 2.92 六、变异系数(coefficient of variation) 亦称离散系数,是标准差s与均数之比,即: 适用范围 观察指标单位不同,如身高、体重 不同单位资料 均数相差悬殊 例:某地20岁男子100人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.7kg,标准差为4.96kg,试比较身高和体重的变异。 变异系数的特点及相应的用途 没有单位 反映标准差占均数的百分比或标准差是均数的几倍 可用来比较度量衡单位不同的资料的变异度 不受平均水平的影响 反映的是以均数为基数的相对变异的大小 比较均数相差悬殊的资料的变异度 平均数与变异度的关系 平均数表示的集中性与变异度表示的离散性,是从两个不同的角度阐明计量资料的特征 变异度越小,平均数对各变量值的代表性越好 变异度越大,平均数对各变量值的代表性越差 通常,平均数与变异指标一起描述资料的分布特征。 用均数和标准差描述正态分布资料的特征; 用中位数和四分位数间距描述偏态分布资料的特征。 变异指标小结 1.极差较粗,适合于任何分布 2.标准差与均数的单位相同,最常用,适合于近似正态分布 3.变异系数主要用于单位不同或均数相差悬殊资料 4.平均指标和变异指标分别反映资料的不同特征, 常配套使用如 正态分布:均数、标准差; 偏态分布:中位数、四分位间距 1. 变异系数主要用于 A.比较不同计量指标的变异程度 B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E.

文档评论(0)

xrwi612 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档