第二章 统计数据的搜集与整理2.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 统计数据的搜集与整理2

一、统计数据的直接来源 调查时间和调查期限 1、调查时间:资料所属时间。 2、调查期限:调查工作的起止时间。 [例]某局欲派员调查B企业2002年的产值及年末职工人数情况,要求调查工作于次年1月1日开始,资料1月底之前上报。 ?调查时间:2002年、2002年末。 ?调查期限:2003年1月。 调查的组织计划 调查工作的领导机构和办事机构; 调查人员的组织 调查资料的报送办法 调查前的宣传、培训、调查文件的准备工作 调查经费的预算和开支办法 调查方案的传达、试点及其他工作 二、统计数据的间接来源 统计摘要 统计资料汇编 统计公告 报刊杂志 网上资料 历史文献 其它来源 年鉴 例如:消费者可以按月收入的高低分类,一项研究要了解月收入在1200元以上和8000元以下的消费者人数 而二手资料中收入段的划分是:200元以下,200~399元, 400~599元, 600~799元, 800~999元, 1000~1499元, 1500~2499元, 2500~3999元, 4000~5999元, 6000~8999元,9000元以上 请问适用性如何? 第三节 统计数据的整理 数据的审核、筛选与排序 数据的审核 发现数据中的错误 数据的筛选 找出符合条件的数据 数据排序 发现数据的基本特征 升序和降序 1、审核 对第一手数据: (1)完整性审核: 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 (2)准确性审核: 真实性:检查数据是否真实反映客观实际情况,内容是否符合实际——逻辑检查(定性数据) 正确性:检查数据是否有错误,计算是否正确等——计算检查 (定量数据) 1、审核 对第二手数据: 完整性 准确性 适用性:数据的来源、口径以及有关背景资料 时效性:尽可能使用最新的数据 2、纠正和筛选 尽可能纠正 无法纠正时应筛选 3.数据的排序:定性、定量 二、数据分组与频数分布 二、数据分组与频数分布 统计分组:根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。 分组标志: 二、数据分组与频数分布 按品质标志分组形成的频数分布 二、数据分组与频数分布 按数量标志分组形成的频数分布 排序 分组 单变量分组:离散型或变量值较少 组距分组:连续型或变量值较多 二、数据分组与频数分布 数据分组的步骤: 1、排序,求全距(极差=最大值-最小值) 2、确定变量的数据形式(单变量分组、组距分组) 3、确定组数(四舍五入): 斯特格斯(Sturges)经验公式: 组数K=1+log10N/log102=1+3.322lgN 4、确定各组组距 组距=极差/组数=(最大值-最小值) /组数 5、根据分组整理成频数分布表(确定各组组限,计算频数) (尽可能使第一组的下限小于最小值,最后一组的上限高于最大值) 频数分布表的编制 (实例) 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121 1、排序,求全距 107 108 108 110 112 112 112 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139 极差=最大值-最小值=139-107=32 2、确定变量的数据形式 3、确定组数 K=1+log10N/log102 =1+3.322lgN =1+3.322×lg50 ≈7 4、确定各组组距 组距=极差/组数 =(最大值-最小值) /组数 =32 /7 =4.6 ≈5 5、根据分组整理成频数分布表 数据分组与频数分布的注意点 1、“不重不漏”原则 连续型变量:习

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档