第二章定量资料的统计描述节解析.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.四分位数间距(Inter-quartile range) Q: 下四分位数QL=P25, 上四分位数Qu=P75 Q=Qu-QL 包含全部观察值的一半 优点:稳定性比极差好 缺点:仍未考虑全部观察值的变异度 适用:描述偏态频数分布以及开口资料的离散程度。 表2-5 50例链球菌咽峡炎患者潜伏期(h)的频率分布表 组段 组中值 频数 频率(%) 累计频数 累计频率(%) 12- 18 1 2 1 2 24- 30 7 14 8 16 36- 42 11 22 19 38 48- 54 11 22 30 60 60- 66 7 14 37 74 72- 78 5 10 42 84 84- 90 4 8 46 92 96- 102 2 4 48 96 108-120 114 2 4 50 100 合计   - 50   -   -   - 3. 方差(variance) 描述所有观察值与均数的平均离散程度的指标。 离均差:每个变量与总体均数的差异。 ∑(X-μ)=0 离均差平方和(mean of squares)SS: SS= ∑(X-μ)2= ∑x2-(∑x)2/n 适用:对称分布的变量,特别是正态分布或近似正态分布 所有观察值的信息描述资料的变异程度,但方差的量纲是原变量量纲的平方。 4.标准差(standard deviation): 方差的算术平方根 适用:对称分布的变量,特别是正态分布 或近似正态分布的变量 5.变异系数(coefficient of variation, CV) 适用:1)量纲不同的变量间 2)均数差别较大的变量间变异程度的比较 公式: 变异系数是无单位 例2-15 1985年通过十省调查得知, 农村刚满周岁的女童体重均数为8.42Kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm.试计算周岁女童身高与体重的变异系数。 体重CV=0.98/8.42=11.64% 身高CV=3.0/72.4=4.14% 第四节 描述分布形态的统计指标 1.偏度系数(coefficient of skewness,SKEW): 理论上:对称分布,总体偏度系数为0 正值:分布为正偏峰 负值:分布为负偏峰 2.峰度系数(coefficient of kurtosis, KURT): 正态分布:总体峰度系数为0 正值:较正态分布的峰尖峭 负值:较正态分布的峰平阔 小结 1.为了解定量资料的分布规律,可编制频率表并绘制频率分布图,用于描述资料的分布特征(集中趋势和离散趋势),以及分布类型(对称或偏峰) 2.集中趋势:算数均数、几何均数、中位数、众数 3.离散趋势:极差、四分位数间距、方差、标准差、变异系数 4.描述资料分布形态的统计指标:偏度系数与峰度系数 5.百分位数是一种位置参数。中位数是一个特殊的百分位数 * 1、数值变量资料 2、由调查或试验收集来的原始资料,往往是零乱的,需要对资料进行整理,首先要考虑如何表达资料,即对资料做统计描述。资料的统计描述一般用统计表、统计图及统计指标。不同类型的资料有不同的描述方法。 3、对连续性数值变量资料,首先可以采用频数表来进行描述。统计图可以选择直方图。统计指标集中趋势和离散趋势的指标。 * * * * * * * 观察值的变异较大,有特大值存在,会影响均数对资料的代表性,故不宜适用均数描述其平均水平。本例资料是偏态分布资料,适宜用中位数描述其集中趋势。 * * 中位数适用于描述任何分布,特别是偏态分布资料(如某些传染病或食物中毒的潜伏期)以及频数分布的一端或两端无确切数据资料(如血铅或发汞值)。 * 均数和中位数都是相同,但凭直观就可以发现这3组数据参差不奇的程度是 不相同的,或者说3组数据的变异程度是不同的,这在分析资料时不能不加以考虑。 A组与B组相似的是数据散布均匀,但B组数据散布的范围明显大于A组; A组C组:数据点散布的范围相同,但是数据点散布的疏密程度不同 B与C:数据点散布范围与疏密程度均不同 * 按间距计算:极差 和四分位数间距 按平均值计算:方差、标准差、变异系数 * * * 为了全面考虑各个观察值得离散情况,克服全距和四分位数间距未能充分利用每个观察值所提供的变异信息的缺点,应寻求一种能利用每个观察值所提供的变异信息的指标。 * 第二章 定量资料的统计描述 第一节 频率分布表与频率分布图 频率分布表(frequency distribution table):

文档评论(0)

挑战不可能 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档