资料统计分析——单变量描述统计.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
资料统计分析——单变量描述统计

项目八:调查资料的统计与分析 (一)频数分布 所谓频数分布(frequency distribution),就是指一组数据中取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。 频数分布表的作用有两方面,一是简化资料,即将调查所得到的一长串原始数据,以一个十分简洁的统计表反映出来。二是从频数分布表中,可以更清楚的了解调查数据的众多信息。 (二)频率分布 所谓频率分布(percentages distribution),就是指一组数据中不同取值的频数相对于总数的比率分布情况,这种比率在社会调查中经常是以百分比的形式来表达。 频率分布表除了频数分布表的优点之外,还有一个重要的优点就是十分方便地用于不同总体或不同类别之间的比较。 频数分布表和频率分布表实例 注意的是,对于一项有一定规模的调查样本来说,一般不宜对如年龄、收入、时间等定比变量做频数分布表或频率分布表。因为,此时类别很多,而每一类别中个案数不多,所得结果繁杂不适用。 二、集中趋势分析 集中趋势测量:用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变量值或特征值就称作集中值或集中趋势。 ★ 众值(Mode)——定类层次 ★ 中位值(Median)——定序层次 ★ 均值(Mean)——定距层次 (一)众数(mode) 1、出现频次最多的变量值; 2、众数的不唯一性; 原始数据:4、5、7、8、19(无众值) 原始数据:4、5、7、5、5、16(一个众值) 原始数据:4、4、5、7、7、9(两个众值) 3、主要应用于定类变量,当然也可以应用于定序和定距变量 1.单值分组资料(非连续取值)求众数 2.组距分组(连续取值)资料求众数 先找出众数组,代入公式 组距分组资料众数求值公式: 解: 找出众数组为222.5—227.5 代入组距分组资料众数求值公式: 练习:求下表众数 从分布来看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值及为众数。 (二)中位数(Median) 把一组数据按顺序排列,处于中间位置的那个数值就是中位值。 主要应用于定序变量,也可用于定距变量,但不可用于定类变量。 将各个个案由低至高排列起来,居序列中央位置的个案值就是中位数。 Md位置= 中位数=中间位置的值 注意:先找位置,再找中位数 ①个案数为奇数 【例3】:甲地的5户人家的人数为:2,4,3,6,8,求中位值。 解:Md的位置= = =3 ②个案数为偶数 【例4】:乙地的6户人家的人数为:2,4,3,6,8,5求中位值。 解:Md的位置= = =3.5 【例5】根据下表求中位值。 解:Md位置 = = =250.5 中位值Md=乙 先找出中位数所在组,利用公式 练习:计算下表中位数 练习:计算下表中位数 (三)平均数(mean) 1、原始资料求均值 某个变项值重复出现多次,可以先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权数,f/n称为权重) 公式: 【例7】调查某年120名学生的年龄,结果如下表,求平均年龄。 解:根据公式得 =18.9岁 3、组距分组资料求均值 先求出组中值 组中值=(上限+下限)/2 计算组中值的和 计算分组数据的均值 众数、中位数和平均数的比较1 众数、中位数和平均数的比较2 平均数比中位数利用了更多的数据信息,对总体的描述更全面和准确。 平均数很容易受到极端值变化的影响,而中位值不会受到这种影响。 对于抽样调查来说,平均数是一种比中位数更为稳定的量度,它随样本的变化比较小。 众数、中位数和均值的关系 练习: 求下表的众数 三、离散趋势分析 离散趋势分析(dispersion tendency analysis),指的是用一个特别的数值来反映一组数据相互之间的离散程度。常见的离散量数统计量有全距、标准差、异众比率、四分位差等。标准差、异众比率、四分位差分别与平均数、众数、中位数相对应,判定和说明平均数、众数、中位数代表性的大小。 (一)全距(Range) 又叫极差,它是一组数据中最大值与最小值之差。 其意义在于一组数据的全距越大,在一定程度上说明这组数据的离散量数越大,而集中量数统计量的代表性越低。反之,一组数据的全距越小,则说明这组数据的离散量数越小,而集中量数统计量的代表性越高。 (二)标准差(standard deviation) 一组数据对其平均数的偏差平方的算术平均数的平方根。用S表示。 1、原始资料求标准差: 【例10】:求标准差,并进行简单比较。 中文系:78

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档