统计学统计数据的描述教案分析.ppt

第2章 统计数据的描述 本章关键词: 计量尺度 集中趋势 离散趋势 本章结构 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理 2.5 分布集中趋势的测度 2.6 分布离散趋势的测度 2.7 略 2.8 茎叶图与箱线图 2.9 统计表与统计图 2.2 统计数据的来源 统计数据的间接来源 统计数据的直接来源 2.2.1统计数据的间接来源 1、 公开出版物:《 中国统计年鉴》、《中国统计摘要》、《中国社会统计年鉴》、《中国工业经济统计年鉴》、《中国农村统计年鉴》、《中国人口统计年鉴》、《中国市场统计年鉴》、《世界经济年鉴》、《国外经济统计资料》、《世界发展报告》…… 2.2.2 直接获取数据 普查(census) 1、它是为某一特定目的专门组织的一次性全面调查 2. 通常是一次性或周期性的 3. 一般需要规定统一的标准调查时间 4. 数据的规范化程度较高 5. 应用范围比较狭窄 小常识 每逢尾数为“0”的年份进行人口普查,我国从1953~2000年共进行了5次人口普查(1953,,1982,1990,2000) 普查应该规定统一的标准调查时间,以避免数据的重复和遗漏,第五次人口普查的标准时间是2000年11月1日零时。 每逢尾数为“3”的年份进行第三产业普查 每逢尾数为“5”的年份进行工业普查 每逢尾数为“7”的年份进行农业普查 每逢尾数为“1”或“6”的年份进行统计基本单位普查 抽样调查(sampling) 它是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。 具有经济性、时效性强、适应面广、准确性高等特点 2.3 统计数据的质量 误差分为非抽样误差和抽样误差 非抽样误差又可以分为登记性误差和系统性误差 抽样误差是利用样本推断总体是产生的误差,是由于样本的代表性产生的,它与样本的容量有关 2.4 统计数据的整理 统计整理是根据统计研究的目的和任务,将搜集到统计资料进行科学的加工和汇总的工作过程。 统计整理的一般过程: 数据的审核、筛选和排序 数据分组 数据汇总 编制统计表 2.4.1 数据的审核、筛选、排序 ? 对原始数据的审核 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等 ?对次级(二手)资料的审核 1、适用性审核 2、时效性审核 3、确认是否必要做进一步的加工整理 数据筛选的内容包括: 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出 2.4.2 统计数据的分组 分组标志是统计分组的依据或标准,正确选择分组标志是进行统计分组的关键,要遵循穷尽性和排斥性原则。 按照分组标志的性质分为: 1、品质分组(按照品质标志分组)适合于列名尺度和顺序尺度计量的数据。 例:人口按性别分组,大学按专业分组、企业按经营类型分组,分数按照优、良、中、合格、不合格划分等。 2、数量分组(按照数量标志分组),适合于间隔尺度和比例尺度计量的数据。 例:人口按年龄、身高分组,企业按劳动生产率分组,商店按照销售额分组。 品质数列举例 表2-2 某车间30名工人周加工零件数的频数分布表 统计分组中的几个概念 单项式数列:指以每个变量值作为一组的名称而形成的分布数列。(例:把广州市常住人口按照每个家庭人口数分组而得到的数列。表2-1也是单项式数列。适用于变量较少的情形。) 几个概念 1、组距 :各组内变量值变动的范围 。 2、组限 :组距的两个端点值 。 3、下限 :每个组变量的起点值 。 4、上限 :每个组变量的终点值 。 5、组距 = 上限-下限 6、以上(下)开口组 组距式分组的步骤: 1、确定组数 建议组数m=1+3.322lgN 其中:N是总体单位数。 2、确定组距 在等距分组的情况下: 组距(C)=全 距(R)÷组数(m) 在一般情况下,组距与组数成反方向变动 。 3、总体单位数归集原则 “下闭上开”或“含下限不含上限”原则。 几个简单计算 1、组中值 (Class midpoint) 封口组: 组中值=(上限+下限)/2 以下开口组:组中值=上限—相邻组距/2 以上开口组:组中值=下限+相邻组距/2 累计频数和累计频率 有两种累计法: 1、向下累积——从最小的变量值(总体频率)开始累计,一直累计到该变量值作为上限的一组为止。 2、向上累积——从最大的变量值(总体

文档评论(0)

1亿VIP精品文档

相关文档