第5,6讲-SPSS探索和交叉表分析.pptVIP

  • 138
  • 0
  • 约4.93千字
  • 约 41页
  • 2017-08-20 发布于河南
  • 举报
第5讲 探索分析和交叉表分析 主讲人:杨七九 开设单位:信息科学与技术系 描述和频率分析回顾 集中趋势的描述统计量 :均值、中位数、众数 ,代表了数据的集中位置 均值(Mean) :代表中心值或平均值的描述统计量,只适用于间隔尺度变量计算 中位数(Median)是将数据排序后,排在第n/2位置上的案例所对应的数值,由于中位数只是进行排序,因此间隔尺度和顺序尺度变量都可以计算中位数,而名义尺度变量不能计算中位数。 在实际应用中,应该根据数据的特点决定使用哪种集中趋势描述统计量,均值的特点是易受极端值影响,因此如果数据中有特别大或特别小的值时,不推荐使用均值,应该使用中位数作为集中趋势统计量。 离散趋势的描述统计量:全距、样本方差、样本标准差 全距(Range)也称极差,定义是:,是一个比较粗糙的描述离散趋势的描述统计量,通过排序就可以获得,它只能说明数据的分布范围,而不能准确刻画数据离中心的程度,因此实际中不常用。由于全距涉及距离,因此,只适合间隔尺度变量计算。 离散趋势的描述统计量刻画了数据离中心的分散程度,也把此类统计量成为分布尺度(Scale)统计量,尺度越大,就越分散,从另一个角度讲,数据越分散,离中心远的数据越多,中心的代表性就越差,因此,也可以认为离散趋势的描述统计量是刻画集中趋势的代表性的统计量。 分布形态的描述统计量 :偏度和峰 偏度是描述数据分布对称性

文档评论(0)

1亿VIP精品文档

相关文档