02--定量资料的描述.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第二章定量资料的统计描述第一节频数分布一、频数分布表(frequencytable)频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。二、频数表与频数分布图(直方图)描述样本特征直观反映概率分布Table1.3108名患者的职业分布Table1.4150名患者某项半定量检验结果的频数分布1.2连续型变量的频数表

例1.某县居民中随机选择120正常成年男子的红血球记数资料如下:5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.045.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69请为这批资料作频数表。(1)求极差(range):即最大值与最小值之差,又称为全距。R=84–57=27(次/分)(2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。27/10=2.7≈3(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56~59~……80~83~85(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。1.4频数图和直方图1.4.1离散型变量的频数图–直条图1.4.2.连续型变量的频数图——直方图

1.5频数表和频数分布图用途1.描述频数分布的类型(对称分布、偏态分布)(1)对称分布:若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布是否为对称分布?是否为对称分布?(2)偏态分布:1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。2)左偏态分布(负偏态分布)左侧的组段数多于右侧的组段数,频数向左侧拖尾。2.描述频数分布的特征表2-1数据的频数分布特征:①数据变异(离散)的范围在57~84(次/分)②数据集中(平均)的组段在68~73(次/分)之间,尤以组段的人数71~(次/分)最多。且上下组段的频数分布基本对称。3.便于发现一些特大或特小的可疑值第二节集中趋势的描述统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:算术均数(均数)(mean)几何均数(geometricmean)中位数(median)与百分位数(percentile)众数(mode)一、算术均数算术均数:简称均数(mean)含义:一组性质相同的观察值在数量上的平均水平。

文档评论(0)

iris + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档