- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 统计数据的描述
【说明】
(一)统计数据的分类、表达形式
1.按数据的计量尺度不同划分
分类数据---列名尺度、定类尺度、名义尺度的计量结果
对事物进行分类的结果,数据表现为类别,用文字来表述
表现为类别,用文字来表述
顺序数据----定序尺度的计量结果
对事物类别顺序的测度
数值型数据----定距尺度、定比尺度的计量结果
对事物的精确测度
结果表现为具体的数值
2.按收集方法划分
1、观测数据(observational data)
2、试验数据(experimental data)
3.按时间状况划分
截面数据(cross-sectional data)
在相同或近似相同的时间点上收集的数据
描述现象在某一时刻的变化情况
时间序列数据(time series data)
在不同时间上收集到的数据
描述现象随时间变化的情况
(二)数据的表现形式
绝对数 按其所反映的时间状况不同,划分为:时期数、时点数
(计量单位有实物单位、价值单位、复合单位)
相对数 包括: 比例 (Proportion)、比率 (Ratio)
(计量单位有百分比、千分比)
统计数据的描述过程
一、第一个环节——统计数据的搜集
(一)统计数据的来源(渠道)
(二)统计数据的搜集方式、方法
(三)统计数据的质量要求(评价标准)
1. 精 度:最低的抽样误差或随机误差
2. 准 确 性:最小的非抽样误差或偏差
3. 关 联 性:满足用户决策、管理和研究的需要
4. 及 时 性:在最短的时间里取得并公布数据
5. 一 致 性:保持时间序列的可比性
6. 最低成本: 以最经济的方式取得数据
二、第二个环节—— 统计数据的整理
【重点】数据的整理与显示的基本原则:
要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的;
对分类数据和顺序数据主要是进行分类整理;
对数值型数据则主要是进行分组整理;
适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。
第一步 数据的预处理
数据的编码:
给问题或答案分配数值
代码
数据的录入
将数据输入计算机中
数据的审核
检查数据中的错误
数据的筛选
找出符合条件的数据
数据排序
升序和降序
寻找数据的基本特征
数据审核
目的:保证数据的质量
不同类型的统计数据在审核内容和方法上有所差异。
对一手数据(原始数据)的审核包括完整性审核如逻辑检查、准确性审核如计算检查
对二手数据的审核着重考虑:适用性审核和时效性审核
数据筛选包括两项内容,即剔除和筛选出来
可以借助计算机来完成
数据排序 (方法)
分类数据的排序
字母型数据,排序有升序降序之分,但习惯上用升序
汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分
数值型数据的排序
递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n)
递减排序:可表示为:x(1)x(2)…x(n)
可以借助计算机来完成
第二步 数据分组或分类
一、含义
二、分组标志的选择原则
三、统计分组的基本类型(方法)
(一)按品质标志分组——简单分组、复合分组
(二)按数量标志分组——单变量值分组、组距分组(等距或异距)
四、等距分组的步骤
从全部数据中找出最大值和最小值→计算全距R→确定组数K和组距d→确定组限的标记法
→确定各组组限
Sturges(斯特格斯)经验公式
(其中:K为组数,N为数据的个数)
第三步 统计数据的计算、汇总 包括两方面内容:
一是确定相关指标
二是描述统计数据的分布特征
一、计算和汇总的常用指标
频数(又称次数)(freguency)
频率(又称比例、比重)(proportion)
比率(ratio)
累积频数、累积频率
二、描述分布特征
三个方面:
A.集中趋势的描述
B.离散程度的描述
C.分布形状(偏态与峰度)的描述
变量集中趋势分布特征的描述(第二节)
(一)集中趋势的内涵
1、集中趋势的含义(Central Tendency)
常用集中趋势指标分类——统计平均数
众数(Mode)
位置平均数 中位数(Median)
四分位数 (Quartile)
数值平均数 算术平均数(Average)
几何平均数(Geomean)
调和平均数(Harmean)
2、集中趋
文档评论(0)