描述性统计分析SPSS应用课件.pptVIP

  1. 1、本文档共99页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二章描述性统计分析

主要内容统计分析和研究的特点单变量的描述性统计频数分析描述性分析探索性分析

一、统计分析和研究的特点大量观察、建立数据库描述统计:用统计学来简化数据,描述特征和关系。推论统计:用统计学可以从局部(样本)来推论总体的情况。

二、单变量的基本描述技术一般来说,原始的资料往往是杂乱无章的。零散地分布在问卷和文献中,因此必须对资料进行加工对资料的加工和分析从单变量的分析开始。单变量的特征包括分布、统计表和统计图

分布特征如何?频数(Frequency)百分比(percent)对比值(ratio)累计频数(CumulativeFrequency)累计百分比(cumulativepercent)

基本技术之统计表表号——在文章中便于查阅、引用。表头,包括标题、时间和地点纵栏标题横行标题总计行

(一)定类层次1.频数与频数分布(1).频数(frequency):也称次数,它是归属各类别的个案数。(2)频数分布(frequencydistribution):把各个类别及其相应的频数全部列出,并用表格形式表示出来,就是频数分布。这个表格就是频数分布表。

o频数分布表通过对原始资料的初步简化,可以简洁明了地反映原始数据的情况。但是因为样本规模的不同,通常不能直接用来比较信息,为什么?

2.百分比(percent):频率社会统计中通常用百分比来表示,绘制的表格一般是百分比表,但表的最下一行一般要注明频数。上表1中,已婚者与各机关人数的比例分别是:o甲机关:乙机关:甲、乙机关已婚者所占的百分比分别是65.0%和57.1%,

o如果只看次数,乙机关已婚者远高于甲机关,但从百分比来看,甲机关已婚的比例则较大。o频数分布表是不同类别的绝对数量的分布情况,百分比分布表则是不同类别在总体中的相对数量分布,因此,百分比分布除具备频数分布的特点外,还可以十分方便地进行不同总体或不同类别之间的比较,应用更为广泛。

o3.对比值(ratio):不同类别数值之间的比值,用x:y的形式表示如出生性别比为105:100,则表示每出生100个女孩则有105个男孩出生某班男女生比率为3:5

(二)定序层次:累积频数和累积频率累积频数(cumulativefrequencies):将各有序类别或组的频数逐级累加起来。累积频率(cumulativepercentages):就是将各有序类别或组的百分比逐渐累加起来。作用:使我们容易知道某值以下或以上的次数或百分比之和

(1)向上累积:从类别顺序的开始的一方向类别顺序的最后一方累加频数(由低级向高级水平的加和)

(2)向下累积o从类别顺序的最后一方向类别顺序的开始的一方累加频数。(由高级或大数值一方向低级或较小数值一方的累加)

如:某校学生的家庭月收入收入(元)500-699700-899fCf↑10Cf↓550540106575900-10991261100-12991581300-14991411500-16994021136951055047533918140550总数

(三)定距层次:分组与组距

1、分组是根据统计研究的需要,将数据按照某种标准化分成不同的组别,分组后再计算出各组中出现的频数或频率,形成一张统计分析表。

(1)组限:每组的范围,o包括上限(Upperlimit)和下限(lowerlimits)o如100-200,下限就是100,上限就是200

(2)分组遵循的两大原则o“不重不漏”的原则“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现。“不漏”是指组别能够穷尽,及在所分的全部组别中某项数据都能分在其中的一组,不能遗漏。

o“上组界不包括在内”的原则

(3)组距:是一个组的上限与下限的差,o可根据全部数据的最大值和最小值及所分的组数来确定o组距=(最大值-最小值)/组数组距=真实上限-真实下限(李沛良书p41-42)

数据的分组,通过“transform”—“recode”命令完成

(4)组中值:处于一组中间位置的值o真实上限与真实下限的平均值组中值=(上限+下限)/2如,100-200,200-300,300-400分组数据的组中值:150,250,350那么100-199,200-299,300-399分组的组中值是多少?

基本技术之统计图o饼图

条形图

o直方图o直方图是以长条的面积(长与宽的乘积)来表示频数或相对频数;条形的长度,即纵轴高度表示单位组距所含有的所有频数或相对频数的密度。仅适用于定距及以上层次的变量

o折线和曲线图

定距变量资料分布常用曲线oJ形曲线

U形曲线

峰状曲线

对称与不对称曲线

o注意:适用于较低测量层次的统计法,也适用于较高的层次。o图形也同样:饼图主要是用于定类变

您可能关注的文档

文档评论(0)

136****1909 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档