第4章_基本统计分析.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章_基本统计分析

统计分析与SPSS的应用 第4章 基本统计分析 第4章 基本统计分析 利用基本统计分析,掌握数据的基本统计特征和把握数据的总体分布形态 基本统计分析的内容: 单个变量的频数分布表 描述统计量 交叉频数分布表 其他探索性分析 数据的多选项分析 4.1 频数分析 基本任务一:频数分布表 频数(Frequency) 百分比(Percent) 有效百分比(Valid Percent) 累计百分比(Cumulative Percent) 基本任务二:统计图 柱形图或条形图(Bar Chart) 饼图(Pie Chart) 直方图(Histograms) 4.1 频数分析_例1 例4-1 分析住房状况调查数据中户主的从业状况和目前所住房屋的产权情况 思路:利用频数分布表及图形 条件:都是分类变量,直接分析 步骤: 调用命令: Analyze\Descriptive Statistics\Frequencies 选择分析变量 选择图形 选择分布表输出格式 4.1 频数分析_例1分析结果 4.1 频数分析_扩展功能 分位数(Pencentile Values) 四分位数(Quartiles) N等分分位数(Cut points for n equal groups) 任意分位数(Percentile) 4.1 频数分析_扩展功能例 案例4-2 分析人均住房面积的分布,并对本市户口和外地户口家庭的人均住房面积分布情况进行比较。 特点:“人均住房面积”是定距型变量 步骤: 根据“人均住房面积”建立分组变量; 调用命令频数分析命令Frequencies 选择分组变量作为分析变量 再一次使用频数分析命令Frequencies 选择“人均住房面积”作为分析变量 不选择生成频数表,选择不生成图形 选择计算四分位数 根据“户口状况”对数据进行拆分(Split File) 再重复上一步的工作(计算分类的四分位数) 案例4-2分析结果1 案例4-2分析结果2 4.2 计算基本描述统计量 更准确地描述定距型数据的分布特征 类型: 集中趋势统计量 离散趋势统计量 分布形态统计量 4.2.1 基本描述统计量 集中趋势(Central Tendency)——一组数据向某一中心值靠拢的倾向。 均值 (Mean)(定距) 中位数(Median)(定距、定序) 众数(Mode)(定类、定序、定距) 均值标准误差(S.E. of Mean) 离散趋势(Dispersion)——一组数据远离其中心值的程度。 样本标准差(Standard Deviation: Std Dev) 样本方差(Variance) 全距(Range) (异众比率) 4.2.2 应用例一 案例4-3:计算人均住房面积的基本描述统计量,并对本市户口和外地户口家庭的情况进行比较。 操作步骤: 调用命令Analyze\Descriptive Statistics \Descriptives 选择“人均面积”作为分析变量 选择必要的分析指标 根据户口状况对数据进行拆分(Split File) 重新调用命令\Descriptives计算不同户口状况的指标值 4.2.2 应用例一分析结果 4.2.2 应用例二 变量的标准化值(Z分数) 经过公式:zi=(xi-x)/S计算得到的值称为xi的标准化值(Z分数) 衡量xi偏离平均数x多少个标准差单位 如果zi的绝对值大于3,则xi可认为是异常值 例2(案例4-4) 根据住房调查数据,分析人均住房面积是否存在不均衡现象。 思路:不均衡=存在异常值,计算标准值,统计异常值的比例,如果超过0.3%,则可以认为有不均衡。 步骤:利用Descriptives命令计算标准值(可省),再用频数分析方法统计异常值的比例。 结论:异常值比例为1.6%>0.3%,有不均衡现象 4.3 交叉分组下的频数分析 4.3.1 目的和基本任务 目的:交叉分组下的频数分析又称列联表分析。分析多个变量不同取值下的分布,进而分析变量之间的相互影响和关系。对于这种涉及两个或两个以上变量分布情况的研究通常要利用交叉分组下的频数分析来完成。 基本任务: (1)根据收集到的样本数据,产生二维或多维交叉列联表; (2)在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析。 4.3.2 交叉列联表的主要内容 编制交叉列联表是交叉分组下频数分析的第一个任务。交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。 例:职工基本情况数据按职称和文化程度编制的二维交叉列联表(见下页表): 上表中的职称变量称为行变量(Row),文化程度称为列变量(Column)。行标题和列标题分别是两个变量的变量值(或分组值)。表格中间是观测频数(Observed Counts)

您可能关注的文档

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档