网站大量收购独家精品文档,联系QQ:2885784924

[教育]8项目八 调查资料统计与分析.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[教育]8项目八 调查资料统计与分析

项目八 调查资料统计与分析 任务一 单变量描述统计 任务二 单变量推论统计 任务三 双变量相关分析 任务一 单变量描述统计 【相关知识】   单变量描述统计分析的目的在于用比较简洁的数据反映大量数据资料中所包含的基本信息。其基本方法包括变量的频次分布与频率分布、集中趋势与离散趋势分析等。 一、频次分布与频率分布 频次分布反映的是变量每个取值出现的次数。频率分布反映的是变量每个取值的次数在全部个案数中所占的比例,也称相对频次分布,一般用百分比分布来表示。 频次分布与频率分布主要适用于定类变量和定序变量的描述。 通常用统计表或统计图的形式来呈现变量的频次分布与频率分布。 统计表 统计表有比较固定的规范格式,从其结构上看,通常由表号、总标题、横行标题、纵栏标题、数字、注释与资料来源等要素构成。 制作统计表应当遵循科学、规范、简明、实用、美观等基本规范。 统计表举例 统计图 统计图主要用于描述调查资料的初级统计结果,特别是描述调查总体的内部构成,展示不同现象的分布或某种现象的变化趋势,具有直观、形象和一目了然的优点。制作统计图时,一般将图号与标题置于图的下方。 用于呈现变量频次分布与频率分布的统计图主要有条形图、饼形图和直方图。 统计图举例 二、集中趋势分析 集中趋势分析是指用典型值或代表值来反映一组数据的一般水平,也即反映这组数据向这个典型值或代表值集中的情况。 集中趋势分析常用表示集中程度的统计量数(即集中量数)来表示,这些集中量数主要有众数、中位数和平均数(也称均值)等。 众数 众数是变量所有取值中出现次数最多的那个取值。 从理论上讲,众数这一统计量数可应用于所有测量尺度,但在实际操作中,一般只用于定类测量和定序测量。 举例:指出表8-4中的众数 中位数 中位数是指把变量的取值按照大小或高低顺序排列起来,位于中间位置上的那个取值。 它可以应用于定序尺度以上层次的测量。其基本含义是:在整个数据中,有一半个案的数据值在它之上,另一半个案的数据值在它之下。 举例一:指出表8-6中的中位数 举例二:指出表8-5中的中位数 表8-5所给出的是组距分组资料。 在组距分组资料中,首先需要计算出全部数据的中间位置,并找到中间位置所对应的数据组,然后可以根据下限公式求中位数。 平均数 平均数是指各单位数值之和除以单位总数目所得的商,一般用表示样本平均数。 平均数用于反映一组定比测量数据的平均水平,与众数、中位数这两个集中量数相比,平均数的计算要用到变量的所有取值,因而,它对资料的利用率是最高的,但是平均数的大小往往容易受到极值的影响,而且,如果当分组中存在开区间组时,无法计算平均值。 平均数的计算公式,因资料形式的不同而不同 举例:求表8-5 、8-6中的平均数 三、离散趋势分析 离散趋势分析就是用表示离散程度的统计量(即离散量数)来反映一组数据的各个数值距离它的代表值的差异程度。离散量数越大,说明典型值的代表性越差;离散量数越小,说明典型值的代表性越好。 常用的离散趋势统计量有异众比率、四分位差、全距、标准差、离散系数等。 异众比率 异众比率是指非众数次数与总体全部次数之比。 异众比率适用于定类测量,用于补充说明众数的代表性。 异众比率越小,说明众数的代表性越好;异众比率越大,说明众数的代表性越差。 四分位差 四分位差Q是指舍去一组数据中最大和最小的1/4,只计算中央1/2的资料中的最大值与最小值之差。 四分位差适用于定序尺度以上测量,用于补充说明中位数的代表性。四分位差越小,说明中位数的代表性越好;四分位差越大,说明中位数的代表性越差。 四分位差的大小不受极值的影响,因而当一组数据中出现极值比较小或比较大的情况时,可以考虑用四分位差来衡量其离散程度。 举例:求表8-8中的四分位数 全距 全距,也称极差,是指一组数据中最大值与最小值之差。 全距越小,表明集中量数的代表性越好;全距越大,表明集中量数的代表性越差。 标准差 标准差是指一组数据中的各个数值与这组数据的平均值之差的平方和除以该组数据个数所得的值的平方根。 标准差适用于定距和定比测量,用于补充说明均值的代表性。标准差越小,表明均值的代表性越好;标准差越大,表明均值的代表性越差。 标准差的计算公式,因资料形式的不同而不同 离散系数 离散系数,又叫变差系数,是指标准差与平均数的比值,常用百分比表示。 这是一种不带单位的表示离散程度的统计量,可用于对同一总体中两种不同单位的离散量数或不同总体中同一离散量数进行比较。 【实作训练】      利用《昆明市低保制度实施状况调查》SPSS数据文件(截取了232个个案的信息),学习如何通过SPSS生成频数分布和频率分布表以及求集中量数和离散量数。 操作过程: 依次单击分析(A)→描述统计→123频率(

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档