[管理学]第2章 统计数据的描述5-10.ppt

  1. 1、本文档共256页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[管理学]第2章 统计数据的描述5-10

2.5 统计数据的整理 2.5.1 数据整理的概念和步骤 数据整理的概念 统计数据整理,是指根据统计研究的目的,将统计调查所得的原始数据进行科学的分组和汇总,使之系统化、条理化的工作过程。 数据整理的步骤 设计和编制统计数据整理汇总方案; 对调查的统计数据进行审核; 统计数据的分组和汇总; 将汇总整理的结果编制成统计表或统计图; 做好统计数据的系统积累和保管。 数据的审核 (原始数据Check—Raw Data ) ? 审核的内容 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 准确性审核 数据的审核 (第二手数据Second Hand Data ) 适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要 时效性审核 应尽可能使用最新的统计数据 确认是否必要做进一步的加工整理 数据的筛选 对审核过程中发现的错误应尽可能予以纠正 当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选 数据筛选的内容包括: 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出 数据的排序 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成 数据的排序 定类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 定距和定比数据的排序 递增排序:设一组数据为X1,X2,…,XN,递增排序后可表示为:X(1)<X(2)<…<X(N) 递减排序可表示为:X(1)>X(2)>…>X(N) 品质数据的整理(显示) 定类数据的整理(显示) 定序数据的整理(显示) 1. 定类数据的整理(显示) (基本过程) 1、列出各类别 2、计算各类别的频数 3、制作频数分布表 4、用图形显示数据 定类数据的整理 (可计算的指标) 频 数:落在各类别中的数据个数。 频 率:某一类别数据的频数占总体单位个数的比重。 百分比:将对比的基数作为100而计算的比值。 定类数据整理—频数分布表 (实例) 定类数据的图示—条形图 条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。 条形图有单式、复式等形式。 在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率。 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。 定类数据的图示—条形图 (由 Excel 绘制的条形图) 定类数据的图示—圆形图 也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形。 主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。 在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的。 例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=91.80,其余类推。 定类数据的图示—圆形图 (由 Excel 绘制的圆形图) 2. 定序数据的整理 (可计算的指标) 1. 累计频数(cumulative frequencies):将各类别的频数逐级累加 2. 累计频率(cumulative percntages) :将各类别的频率(百分比)逐级累加 a.累计频数(频率)有以下两种计算方法: (1)向上累计 向上累计,又称“以下累计”,是将各组频数或 频率由变量值低的组向变量值高的组累计。 各累计数的意义是各组上限以下的累计次数或 比率。 (2)向下累计 向下累计,又称“以上累计”,是将各组频数或频 率由变量值高的组向变量值低的组累计。 各累计数的意义是各组下限以上的累计次数比率。 定序数据频数分布表A (实例 ) 定序数据频数分布表B (实例 ) 定序数据图示—累计频数分布图 /meeting.asp?meetId=334# /macro/main/rdgz/hgzt/srcj/ 目前我国反映收入分配差异的基尼系数为0.46,收入分配相当不均。但是我们从城乡分别来看,城市的基尼系数是0.34,农村的基尼系数是0.37,也就是城乡作为两个部分各自的差距不是很大,但是把城乡综合在一起就达到0.46,这说明主要是城乡差距造成了基尼系数的扩大,这种状况相对于城乡比较普遍的拉开收入差距,贫民区与灯红酒绿邻里相望的状态对比,冲击力要小些,对社会稳定的破坏力也要小

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档