[2018年最新整理]spss描述性统计.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[2018年最新整理]spss描述性统计

第八章 描述統計 量化研究與統計分析 第一章 科學研究與量化方法 第八章 描述统计的原理与应用 Data Graphing 课程目标 介绍描述统计的原理 了解集中量数的特性与各量数 了解变异量数的特性与各量数 了解相对量数的特性与各量数 了解标准分数的特性与各量数 熟习描述统计的SPSS运作 描述统计 描述统计的定义 一套用以整理、描述、解释资料的系统方法与统计技术 数据从初始状态(raw data)成为可被理解的统计量数(statistic)的一套操作程序 透过统计量数来描述大量资料,并作为彼此沟通的共同符号语言 集中量数 集中量数(measures of central location) 用以描述一组数据或一个分配集中点的统计量数 一个能够描述数据的共同落点的指标。 常用的集中量数有平均数、中位数及众数 平均数 平均数(mean;以M表示) 取某一变项的所有数值的总和除以观察值个数所得到的值 因为是将数据直接以数学算式来计算平均值,又称为算术平均数(arithmetic mean)。 母体资料得出的平均数需以希腊字μ表示 中位数 中位数(median;或以Mdn表示) 又称为中数、百分等级为50的百分位数(P50)或第二四分位数(Q2; second quartile)。 将某一个变项的数据依大至小或由小至大排列,取位居最中间、或能够均匀对分全体观察值的分数 在中位数之上与之下,各有50%的观察值。 众数 众数(mode;或以Mo表示) 一组分数中,出现次数最多的一个分数 一组数据中最典型(typical)的数值或次数分配最高点所对应的分数 是各集中量数当中,最容易辨认的量数 一个分配有两个分数具有相同的最高次数,此时即出现了双众数,称为双峰分配(bimodal distribution) 集中量数的特性与优缺点比较 三种集中量数与分配形状的关系 变异量数 变异量数(measures of variation)或离散量数 用来描述观察值在某一个变项上的分数分散情形的统计量 描述统计中,集中量数必须搭配变异量数,才能反应一组数据的分布特征 常用的变异量数包括全距、四分差、变异数及标准差 全距 全距(range) 一组分数中最大值(Xmax)与最小值(Xmin)之差 是一群分数变异情形最粗略的指标 全距容易计算,适用性高,可以应用在名义变项与顺序变项,来求出变项当中类别的多寡。 缺点是不精确也不稳定,无法反应一个分配的每个数值的状态。 四分差 四分差(semi-interquartile range; QR) 是一组数据当中的第三四分位数(区隔高分端的前25%的分数,简称Q3)与第一四分位数(区隔低分端的后25%的分数,简称Q1)距离的一半 中间百分之五十的样本分数差距的二分之一 离均差与平方和 离均差 一组数据中,各分数与平均数的距离,通常以小写的x来表示 当离均差为正值时,表示分数落在平均数的右方 离均差为负值时,表示分数落在平均数的左方 平均数是每一个分数加总后的平均值,为一组分数的重心位置 离均差平方和(sum of squares; SS) SS的概念可以类比为面积的概念,表示分数与平均数变异的面积和 变异数与标准差 变异数 平均化的离均差平方和 标准差 变异数的开方,以σ表示。标准差或变异数越大者,表示该分配的变异情形较大。 变异数的不偏估计数 标准差与变异数的不偏估计数的主要差别在于分母项为N-1而非原来的N N-1称为自由度(degree of freedom;df),表示一组分数当中,可以自由变动的分数的个数。 在离均差的计算上,自由度为样本数减1,表示在N个观察值中,只有N-1个数字可以自由运用于离均差的计算。 变异量数的特性与优缺点比较 偏态(Skewness) 描述一个变项的对称性(symmetry)的量数称为偏态系数 不对称的资料称为偏态资料,依其方向可分为负偏(negatively skewed)(或左偏,即左侧具有偏离值)、正偏(positively skewed)(或右偏,即右侧具有偏离值)与对称(symmetrical)三种情形 地板与天花板效应 地板效应(floor effect) 指数据多数集中在偏低的一端,但在高分端则有极端值,分数不容易突破低分端,但会往高分端延伸,彷彿有一个地板(或真的存在一个低分限制条件)阻挡了数据往低分移动。 由于地板阻隔作用,地板效应常伴随正偏态现象。 天花板效应(ceiling effect) 则与负偏态有关,是指数据多数集中在偏高的一端,但在低分端则有极端值,分数不容易突破高分端,彷彿有一个天花板(或真的存在一个高分限制条件)阻挡了数据往高分移动。 峰度(Kurtosis) 是指一个

文档评论(0)

liwenhua11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档