0100-3统计数据整理.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数值型数据的整理与展示 数值型数据的图示: ?原始数据:茎叶图与箱线图 ?分组数据:直方图 ?时间序列数据:线图 ?多变量数据:散点图、气泡图、雷达图 时间序列数据(Time series data):线图 数值型数据的整理与展示 数值型数据的图示: ?原始数据:茎叶图与箱线图 ?分组数据:直方图 ?时间序列数据:线图 ?多变量数据:散点图、气泡图、雷达图 双变量数据(Time series data):散点图 ?以意大利经济学家V.Pareto的名字而命名。也称排名图或主次因素图,用条形的长短表示各组的绝对数的多少,用线段的逐渐上升趋势表现各组构成接近100%的过程。它是条形图和构成图的结合。直条从高到低依次排列。 帕累托图 2000年全国人口年龄段构成的简单帕累托图 ?常用来作为质量控制工具,对个体或均数的变动情况进行监测。它是根据数理统计原理来确定一个范围,用以界定观察值或均数的波动是正常或异常的,并以图的形式表达。 质量控制图 5位评委的均数质控图 合理使用图表 鉴别图表优劣的准则: ?精心设计、有助于洞察问题的实质 ?使复杂的观点得到简明、确切、高效的阐述 ?能在最短的时间内以最少的笔墨给读者提供最大量的信息 ?如实反映数据 ?熟悉Excel的基本操作 ?描述统计的Excel应用 ?图形的绘制 ?数据库管理 上机内容 * * * * * * * * * * * * * * * * * * 再如:通过调查取得100个商业企业某月销售额资料:(单位:万元) 20,60,45,90,105,56,250,89,130,30,98,…300。 将这些数据资料按“销售额”的多少进行整理,得到下列整理结果: 统计整理的方法:分组、汇总、编表 100 合 计 12 25 30 23 10 0 — 50 50 — 100 100— 150 150— 200 250— 300 企业数(个) 销售额(万元) 数值型数据的整理与展示 数值型数据的整理与展示 ?将一个变量值作为一组 ?适合于变量值较少的离散型数据 数值型数据的整理与展示 ?将变量值的一个区间作为一组 ?适合于变量值较多的连续型变量 ?分为等距分组和异距分组 等 距 分 组 各组组距均相等。如: 10—20 20—30 30—40 以上各组组距均为10。 这种分组适用于均匀分布的总体。 不等距 分 组 各组组距不一定相等。如: 10—20 20—50 50—60 60—70 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。 数值型数据的整理与展示 ?上限(upper limit) :一个组的最大值 ?下限(low limit) :一个组的最小值 ?组距(class width) :上限与下限之差 ?组中值(class midpoint) :下限与上限之间的中点值 组限 组限就是每一组两端的数值。 10 — 20 20 — 30 30 — 40 下限 上限 确定组限的方法有两种:间断式组限和重叠式组限。 职工人数(人) 99以下 100—199 200—299 300—399 固定资产额(万元) 50—60 60—70 70—80 80—90 间断式组限 适用于离散变量 重叠式组限 适用于连续变量 间断式确定组限:汇总各组单位数时,按照“上下限均 包括在本组内”的原则汇总。 职工人数(人) 499以下 500 — 599 600 — 699 700 — 799 重叠式确定组限:汇总各组单位数时,按照“上组限不在 内”的原则汇总。 产值(万元) 50 — 60 60 — 70 70 — 80 80 — 90 单位数(个) 单位数(个) 因为有了“上组限不在内”的原则,实际工作中,对 于离散型变量也经常采用重叠式确定组限的方法。 组中值 每组上限与下限之间的中点数值,是各组的假定平均数。 组中值 = (上限值+下限值)÷2 开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2 缺上限:组中值=本组下限+ 相邻组组距/2 产值(万元) 50以下 50 — 60 60 — 70 70以上 第一组组中值: 50-(1

文档评论(0)

dmz158 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档