第二章-描述性统计分析SPSS应用.ppt

  1. 1、本文档共99页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 描述性统计分析 主要内容 统计分析和研究的特点 单变量的描述性统计 频数分析 描述性分析 探索性分析 一、统计分析和研究的特点 大量观察、建立数据库 描述统计:用统计学来简化数据,描述特征和关系。 推论统计:用统计学可以从局部(样本)来推论总体的情况。 分布特征如何? 频数(Frequency) 百分比(percent) 对比值(ratio) 累计频数(Cumulative Frequency)累计百分比(cumulative percent) (一)定类层次 1.频数与频数分布 (1).频数(frequency):也称次数,它是归属各类别的个案数。 (2) 频数分布(frequency distribution):把各个类别及其相应的频数全部列出,并用表格形式表示出来,就是频数分布。这个表格就是频数分布表。 频数分布表通过对原始资料的初步简化,可以简洁明了地反映原始数据的情况。但是因为样本规模的不同,通常不能直接用来比较信息,为什么? 2.百分比(percent):频率 社会统计中通常用百分比来表示,绘制的表格一般是百分比表,但表的最下一行一般要注明频数。 上表1中,已婚者与各机关人数的比例分别是: 甲机关: 乙机关: 甲、乙机关已婚者所占的百分比分别是65.0%和57.1%, 如果只看次数,乙机关已婚者远高于甲机关,但从百分比来看,甲机关已婚的比例则较大。 频数分布表是不同类别的绝对数量的分布情况,百分比分布表则是不同类别在总体中的相对数量分布,因此,百分比分布除具备频数分布的特点外,还可以十分方便地进行不同总体或不同类别之间的比较,应用更为广泛。 3. 对比值(ratio):不同类别数值之间的比值,用x:y的形式表示 如出生性别比为105:100,则表示每出生100个女孩则有105个男孩出生 某班男女生比率为3:5 (二)定序层次:累积频数和累积频率 累积频数(cumulative frequencies):将各有序类别或组的频数逐级累加起来。 累积频率(cumulative percentages):就是将各有序类别或组的百分比逐渐累加起来。 作用:使我们容易知道某值以下或以上的次数或百分比之和 (1)向上累积: 从类别顺序的开始的一方向类别顺序的最后一方累加频数(由低级向高级水平的加和) (2)向下累积 从类别顺序的最后一方向类别顺序的开始的一方累加频数。(由高级或大数值一方向低级或较小数值一方的累加) 如:某校学生的家庭月收入 (三)定距层次:分组与组距 1、分组是根据统计研究的需要,将数据按照某种标准化分成不同的组别,分组后再计算出各组中出现的频数或频率,形成一张统计分析表。 (1)组限:每组的范围, 包括上限(Upper limit)和下限(lower limits) 如100-200,下限就是100,上限就是200 (2)分组遵循的两大原则 “不重不漏”的原则 “不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现。 “不漏”是指组别能够穷尽,及在所分的全部组别中某项数据都能分在其中的一组,不能遗漏。 “上组界不包括在内”的原则 (3)组距:是一个组的上限与下限的差, 可根据全部数据的最大值和最小值及所分的组数来确定 组距=(最大值-最小值)/组数 组距=真实上限-真实下限(李沛良书p41-42) 数据的分组,通过“transform”—“recode”命令完成 (4)组中值:处于一组中间位置的值 真实上限与真实下限的平均值 组中值=(上限+下限)/2 如,100-200,200-300,300-400分组数据的组中值:150,250,350 那么100-199,200-299,300-399分组的组中值是多少? 基本技术之统计图 饼图 条形图 直方图 直方图是以长条的面积(长与宽的乘积)来表示频数或相对频数;条形的长度,即纵轴高度表示单位组距所含有的所有频数或相对频数的密度。仅适用于定距及以上层次的变量 折线和曲线图 定距变量资料分布常用曲线 J形曲线 U形曲线 峰状曲线 对称与不对称曲线 注意:适用于较低测量层次的统计法,也适用于较高的层次。 图形也同样:饼图主要是用于定类变量 条形图主要是用于定序变量;直方图、折线图等主要是用于定距变量 练习:城镇自杀率的分组次数分布 三、集中趋势测量 用分布来研究单变量是最全面的分析方法 在很多情况下,我们只要了解其大概或分布的主要特征以便简化资料。于是就产生了用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变量值或特征值就是集中值或集中趋势。 统计分析首先要解决的问题,就是寻求一个简单数值以代表搜集所得的资料。 下面是一个

文档评论(0)

kbook + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档