定量资料的统计描述2014课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定量资料的统计描述2014课件

定量资料的统计描述;学习要求;*;1.频数表的绘制;*;频数(frequency) 观察数据的个数 频数分布(frequency distribution) 观察数据在其取值范围内的分布情况 定量资料的频数分布情况可以用频数表(frequency distribution table)或直方图表示。;2.频数表的应用;120名8岁男孩身高频数表;2.1描述分布类型;120名8岁男孩身高频数表;不对称分布——强调:偏态分布 正偏态分布:频数集中在数据小侧 负偏态分布:数据集中在数据大侧 本例为正偏态分布 医学资料常见偏态分布。;;;;;2.2描述分布特征;120名8岁男孩身高频数表;2.3发现离群值;3.描述平均水平;3.1算术均数(简称均数mean);直接法:适用于样本含量较小的未分组资料 说明:x表示变量值,∑表示求和,n表示样本含量;加权法:适用于样本含量较大的频数表资料 说明:此处x表示组中值,f表示频数,∑表示求和 例:120名8岁男孩的身高资料 ;3.2中位数(median,M);直接法:样本含量较小的未分组资料。 n为奇数时: n为偶数时: 4 4 5 5 6 6 170 4 4 5 5 6 6 ?;加权法:适用于样本含量较大的频数表资料 公式: 说明:L表示M所在组段的下限;i表示该组段的组距;f表示该组段的频数;n表示样本含量;∑fL表示小于该组段的累计频数。 例:M=12+12/56(150/2-23) =23.14(小时);适用情况:任何分布类型,尤其适用于下列情况 偏态分布 开口资料 分布不清;3.3百分位数(percentile,PX);3.4几何均数(geometric mean,G);直接法 加权法;注意事项 几何均数常用于等比级资料或对数正态分布资料。 观察值中若有0或负值,则不宜直接使用几何均数。 观察值一般同时不能有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。;变量变换 2 4 8 16 32 lg2 lg4 lg8 lg16 lg32 0.30 0.60 0.90 1.20 1.51 等比级数资料可以通过对数变换,转化为正态分布;3.5众数(mode);众数、均数、中位数之间的关系;3.6调和均数(harmonica mean,H);;4.描述变异程度;4.1平均数与变异度的关系 ;变异程度是指各观察值之间参差不齐的程度,反映资料的变异程度。 常用指标:极差、四分位间距、离均差平方和、方差、标准差、变异系数等。 反映平均水平和变异程度的指标结合起来,全面认识事物。;4.2极差(range,R,又称全距);适用情况: 描述单峰对称分布小样本资料的变异程度; 初步了解资料的变异程度。;不足之处: 只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度; 样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大,因此样本含量悬殊时不宜用全距比较。 如上例资料B改为: B:1 6 6 7 8 8 13 R=12,则无法区分与资料A的变异程度谁大。;4.3方差、标准差;改用离均差平方和: A资料:(1-7)2+(3-7)2+……+(13-7)2=112 B资料:(1-7)2+(6-7)2+……+(13-7)2=72;离均差平方和的优点:能反映每一个观察值对变异程度的影响。 把资料B作如下修改: B:1 6…6 7 8…8 13(共40个6和40个8) 计算得:(1-7)2+…+(13-7)2=152 离均差平方和的缺点:离均差平方和不能消除观察值个数对指标的影响。;将离均差平方和进一步修改,考虑观察值个数对指标的影响,得方差(varianc): 总体方差: 样本方差: 资料A:s2=18.66,资料B:s2=1.85;方差的优点: 可以反映每个观察值对变异程度的影响;考虑了观察值个数对指标的影响。 方差的不足: 单位是原观察值单位的平方。;进一步修改,得标准差(standard deviation): 总体标准差: 样本标准差: 资料A:s=4.32,资料B:s=1.36;标准差越大,变异程度越大,数据越分散。 标准差的优点: 可以反映每个观察值对变异程度的影响 考虑了观察值个数对指标的影响 单位与观察值相同 标准差适用于对称分布的资料,通常与均数结合使用。 ;4.4四分位数间距(quartile range,Q);4.5变异系数(coeffici

文档评论(0)

feixiang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档