《统计学》2数据的描述例析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 统计数据的描述 【说明】 (一)统计数据的分类、表达形式 1.按数据的计量尺度不同划分 分类数据---列名尺度、定类尺度、名义尺度的计量结果 对事物进行分类的结果,数据表现为类别,用文字来表述 表现为类别,用文字来表述 顺序数据----定序尺度的计量结果 对事物类别顺序的测度 数值型数据----定距尺度、定比尺度的计量结果 对事物的精确测度 结果表现为具体的数值 2.按收集方法划分 1、观测数据(observational data) 2、试验数据(experimental data) 3.按时间状况划分 截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 时间序列数据(time series data) 在不同时间上收集到的数据 描述现象随时间变化的情况 (二)数据的表现形式 绝对数 按其所反映的时间状况不同,划分为:时期数、时点数 (计量单位有实物单位、价值单位、复合单位) 相对数 包括: 比例 (Proportion)、比率 (Ratio) (计量单位有百分比、千分比) 统计数据的描述过程 一、第一个环节——统计数据的搜集 (一)统计数据的来源(渠道) (二)统计数据的搜集方式、方法 (三)统计数据的质量要求(评价标准) 1. 精 度:最低的抽样误差或随机误差 2. 准 确 性:最小的非抽样误差或偏差 3. 关 联 性:满足用户决策、管理和研究的需要 4. 及 时 性:在最短的时间里取得并公布数据 5. 一 致 性:保持时间序列的可比性 6. 最低成本: 以最经济的方式取得数据 二、第二个环节—— 统计数据的整理 【重点】 数据的整理与显示的基本原则: 要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的; 对分类数据和顺序数据主要是进行分类整理; 对数值型数据则主要是进行分组整理; 适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。 第一步 数据的预处理 数据的编码: 给问题或答案分配数值 代码 数据的录入 将数据输入计算机中 数据的审核 检查数据中的错误 数据的筛选 找出符合条件的数据 数据排序 升序和降序 寻找数据的基本特征 数据审核 目的:保证数据的质量 不同类型的统计数据在审核内容和方法上有所差异。 对一手数据(原始数据)的审核包括完整性审核如逻辑检查、准确性审核如计算检查 对二手数据的审核着重考虑:适用性审核和时效性审核 数据筛选包括两项内容, 即剔除和筛选出来 可以借助计算机来完成 数据排序 (方法) 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序 递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n) 递减排序:可表示为:x(1)x(2)…x(n) 可以借助计算机来完成 第二步 数据分组或分类 一、含义 二、分组标志的选择原则 三、统计分组的基本类型(方法) (一)按品质标志分组——简单分组、复合分组 (二)按数量标志分组——单变量值分组、组距分组(等距或异距) 四、等距分组的步骤 从全部数据中找出最大值和最小值→计算全距R→确定组数K和组距d→确定组限的标记法 →确定各组组限 Sturges(斯特格斯)经验公式 (其中:K为组数,N为数据的个数) 第三步 统计数据的计算、汇总 包括两方面内容: 一是确定相关指标 二是描述统计数据的分布特征 一、计算和汇总的常用指标 频数(又称次数)(freguency) 频率(又称比例、比重)(proportion) 比率(ratio) 累积频数、累积频率 二、描述分布特征 三个方面: A.集中趋势的描述 B.离散程度的描述 C.分布形状(偏态与峰度)的描述 变量集中趋势分布特征的描述(第二节) (一)集中趋势的内涵 1、集中趋势的含义(Central Tendency) 常用集中趋势指标分类——统计平均数 众数(Mode) 位置平均数 中位数(Median) 四分位数 (Quartile) 数值平均数 算术平均数(Average) 几何平均数(Geomean) 调和平均数(Harmean) 2、集中趋

文档评论(0)

a5522235 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档