统计教程-数量资料统计描述.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计教程-数量资料统计描述.pdf

统计教程  数量资料统计描述 对数值变量资料进行统计分析的一般步骤,是先对观察测量得到的变量值(即观察值)进行统计描述,再在此 基础上进行深入的统计推断。统计描述的工作主要是在编制频数表的基础上描述资料的集中位置和离散程度。 一、数值变量资料的频数表 1. 频数表(frequency table)的编制方法: (1)找出观察值中的最大值(largest value )、最小值(smallest value )和极差(range )。 (2 )据极差大小确定组段和组距(class interval ),将其分为10 个左右的组段。 (3 )列表划记落在各组段内的观察值个数即可得频数表。 根据编制出的频数表即可了解该数值变量资料的频数分布特征。 2. 频数分布的特征及类型: (1)两个特征:集中趋势(central tendency )和离散趋势(tendency of dispersion ) (2 )两种类型:对称分布(symmetric distribution )和偏态分布(skewed distribution ),偏态分布又有正偏态(positively skewed )和负偏态(negatively skewed )之分。 3. 频数表的用途: (1)描述资料的分布特征和分布类型。 (2 )进一步计算有关指标或进行统计分析。 (3 )发现特大、特小的可疑值。 (4 )据此绘制频数分布图。 二、集中位置的描述 描述一组观察值集中位置或平均水平的指标称为平均数(average )。它能使人对资料有个简明概括的印象,并 能进行资料间的比较。常用的平均数有算术均数、几何均数和中位数。 1. 算术均数(arithmetic mean ) 简称均数(mean ),有总体均数和样本均数之分,分别用希腊字母miu(音)和英文字母x bar(音)表示。 (1)计算方法 不分组资料用直接法。即所有观察值的累积和除以观察值个数, 相同观察值较多或分组资料常用加权法 (weighting method )。 (2 )均数的应用 适用于对称分布,特别是正态分布的资料,不适用于偏态分布的资料。如有数据3、4 、5、6、17,可见数据多 在3-6 之间,但均数为7,显然不能代表这组数据的中心位置,此时应用几何均数或中位数描述其集中趋势。 2. 几何均数(geometric mean ,G ) 适用于呈倍数关系的等比资料或对数正态分布的资料,应用中应注意观察值不能同时有正有负,同一资料算得 的几何均数小于算术均数。 3. 中位数(median) 1  统计教程  中位数是一组观察值的位置平均数,直接由原始数据计算中位数时,若n 为奇数,则中位数为将观察值从小到 大排序后中间位置那个观察值,若n 为偶数,中位数为将观察值从小到大排序后中间两个观察值的算术均数。用 频数表计算中位数时先据频数表计算累计频数(cumulative frequency )和累计频率,百分之五十分位数即为中位 数。 中位数用于描述偏态分布资料的集中位置,它不受两端特大、特小值的影响,当分布末端无确切数据时也可计 算。 百分位数(percentile)是资料分布数列的的百等份分割值,百分位数用于描述样本或总体观察值序列某百分位置的 水平,应用中注意,样本例数不够多时,两端的百分位数不稳定。百分位数还用于确定参考值范围(reference range )。 三、离散程度的描述 多组资料均数相同,只说明其集中趋势相同,各组数据内部观察值参差不齐的程度可能不同。此时,常用极差、 四分位数间距、方差、标准差和变异系数等指标来描述资料的离散程度。 1. 极差(range ,R ) 又称全距,即最大和最小观察值之间的间距,用极差描述资料的离散程度简单明了,但它不能反映观察值的整 个变异度,样本的例数越多,极差越大,不够稳定。 2. 四分位数间距 四分位数( quartile,Q) 是特定的百分位数,其中P25 为下四分位数Ql,P75 为上四分位数Qu 。四分位数间距即 Qu-Ql 。四分位数间距比极差稳定,但仍未考虑每个观察值的变异度。 3. 方差(variance ,Var ) 怎样一个指标才能反映整个资料的变异程度呢? 离均差的绝对值之和或离均差平方

文档评论(0)

zhangchao11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档