- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
描述统计表格与图形方法.
第二章 描述统计:表格与图形方法
第一节 数据的预处理
一、数据审核
1、准确性审核:审核的对象就登记性误差(非抽样误差)采取逻辑检查和计算检查方法
·逻辑检查:主要看调查数据的内容是否合理,项目之间是否有矛盾的地方,以及与有关数据进行对照,或者检查数据的平衡关系,以暴露逻辑上的矛盾
·计算检查:主要是从数字上检查,如各分项之和是否等于总计,计量单位是否合适,计算方法上是否合理等等
2、全面性审核:核对应调查的单位是否有遗漏,应调查的内容是否齐全
3、及时性审核:即是否按规定的时间获取数据资料
二、数据筛选
1、当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选
2、数据筛选的内容
(1)将某些不符合要求的数据或有明显错误的数据予以剔除
(2)将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除
3、数据筛选可借助计算机完成
三、数据排序
1、按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索
2、排序有助于对数据检查纠错,以及为重新归类或分组等提供依据
3、在某些场合,排序本身就是分析的目的之一
4、排序可借助于计算机完成
第二节 定性数据的图表分析
一、频数分布:将统计数据分组后,各组数据出现的次数被称为频数(次数)。把各个组以及相应的频数依一定的次序全部列出来,就形成了频数分布(次数分布)
1、频率:各组单位数占总体单位总数的比重
××定性数据本身就是对事物的一种分类,在列出所分的类别的同时,再列出对应的频数或频率,就形成了分类数据的频数分布。
2、顺序数据的整理(可计算的统计量)
(1)累积频数:各类别频数的逐级累加。包括向上累积和向下累积两类。
(2)累积频率:各类别频率(百分比)的逐级累加。包括向上累积和向下累积两类。
补充:
1向上累计:从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。
2向下累计:从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。
3、比例:也称构成比,它是一个样本(或总体)中各类别的频数与全部频数之比,通常用于反映样本(或总体)的构成或结构。
(1)将比例乘以100得到的数值称为百分比,用%表示。
(2)由比例和百分比我们可以编制相对频数分布表和百分数频数分布表。
二、定性数据的图形表示
·比较适用于定性数据的图形主要有:条形图、饼图、环形图等。
1、统计图—条形图:用宽度相同的条形的高度或长短来表示各类别数据的图形
(1)有单式条形图、复式条形图等形式
(2)主要用于反映分类数据的频数分布
(3)绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图
2、分类数据的图示—饼图:也称圆形图,用圆形及圆内扇形的面积来表示数值大小的图形
(1)主要用于表示总体或样本中各组成部分所占的比例,适用于研究结构性问题
(2)绘图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占360°的相应比例确定的
3、环形图:中间有一个“空洞”,总体中的每一部分数据用环中的一段表示
·环形图与圆形图类似,但又有区别
(1)圆形图只能显示一个总体各部分所占的比例
(2)环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环
(3)环形图可用于结构比较研究
(4)环形图主要用于展示分类和顺序数据
第三节 定量数据的图表分析
频数分布
1、单变量值分组:将每一个变量值作为一组。适合于离散变量且变量值较少的情况
2、组距分组:将全部变量值一次划分为若干个数值区间,每一个区间作为一组。适合于连续变量或变量值较多的离散变量
(1)组距分组的方法:将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。
(2)组距分组 的一些概念
1组限:组距两端的数值分为上限U和下限L。上限是区间数值的最大值,下限是区间数值的最小值
2组距:每一组的区间长度。组距d=上限U-下限L ,表示各组标志值的变动范围。
3组中值X:每一组中点位置的数值。组中值=(上限+下限)÷2
4开口组:缺少上限数值或下限数值的组。开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。
·缺下限的开口组组中值:上限—1/2临组组距
·缺上限的开口组组中值:下限+1/2临组组距
5等距分组:各组组距相等的分组
6异距分组:各组组距不全相等的分组
(3)组距变量数列的编制1确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时, 可以按 Sturges 提出的经验公式来确定组数
文档评论(0)