统计学 第二章 数据的搜集.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 2 章 数据搜集 2.1 数据来源 2.2 调查数据 2.3 实验数据 2.4 数据误差 学习目标 了解数据的来源 理解数据的调查方法 掌握调查方案的结构和设计 掌握调查问卷设计 了解实验数据 了解数据的误差 二手数据的来源 二手数据的特点 二手数据的评估 二手数据的来源 统计部门和政府部门公布的有关资料,如各类统计年鉴 各类经济信息中心、信息咨询机构、专业调查机构等提供的数据 各类专业期刊、报纸、书籍所提供的资料 各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料 从互联网或图书馆查阅到的相关资料 二手数据的特点 收集容易,采集成本低 作用广泛 分析所要研究的问题 提供研究问题的背景 帮助研究者更好地定义问题 检验和回答某些疑问和假设 寻找研究问题的思路和途径 收集二手资料在研究中应优先考虑 二手数据的评估 数据是谁收集的? 可信度评估 为什么目的而收集的? 数据是怎样收集的? 什么时候收集的? 使用二手数据需要注意的问题 应注意数据的含义、计算口径和计算方法,避免误用或滥用; 注意二手数据的时间性,不能用过时的数据; 应充分搞清这些数据的来源和可靠程度; 应注明数据的出处,以尊重他人的劳动成果。 2.1.2数据的直接来源(原始数据) 调查数据 通过调查方法获得的数据 通常是对社会现象而言 通常取自有限总体 实验数据 通过实验方法得到的数据 通常是对自然现象而言 也被广泛运用到社会科学中 如心理学、教育学、社会学、经济学、管理学等 2.2.1统计调查的方式 2.2.2抽样调查的常用方法 2.2.3搜集数据的基本方法 2.2.4调查方案的设计 2.2.1 统计调查方式 普查是为某一特定目的而专门组织的一次性全面调查。 特点: 普查通常是一次性的或周期性的。例如国务院规定每10年进行一次人口普查。 普查一般需要规定统一的标准时点。例如,第5次人口普查的标准时间为2000年11月1日0时。 普查数据的准确性、标准化程度均较高 ; 普查的调查项目较少,适用范围较狭窄,调查资料缺乏深度。 抽样调查(sampling survey) 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法 统计报表(statistical report forms) 2.2.2抽样调查的常用方法 概率抽样 (1)简单随机抽样(simple random sampling)。从有限总体抽取样本时,如果总体中每一个体都有同等机会被选入样本,这种抽样称为简单随机抽样,得到的样本称为随机样本(random sample)。 实践中,得到随机样本并不容易。即使选择对象的确是随机的,最理想的情况所得到的样本也只代表那些愿意回答问题人的观点所组成的总体;没有回答问题的人的观点永远不会被这种调查的样本所代表。 比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数据;这些数据并不是整个人群中采集的随机样本,它们可能只是医院中的病人记录中得到的。 在报纸和网上也有问卷,但得到的只是上了网和有这份报刊,而且愿意回答的人的观点。 抽样框是有关总体全部单位的名录。 特点 简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 局限性 当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率 所以规模较大的调查中,很少直接采用简单随机抽样,一般把这种方法与其他方法结合起来使用。 (2)分层(分类)随机抽样(stratified sampling)。先根据某一特征把总体分为若干类(层,stratum),再从各类中按简单随机抽样原则进行抽样。 比如按照教育程度把要访问的人群分成几类,再在每一类中按其所占比例进行抽样。 层内个体之间的差异越小,而不同层之间的差异越大时,分层抽样的效果好。 (3)整群随机抽样(cluster sampling)。先把总体分为若干群(cluster),再以群为单位进行随机抽样,对抽出来的群进行普查。 比如在某县进行调查,首先在所有村中选取若干村子,然后只对这些村子的人进行调查。显然,如果各村情况差异不大,这种抽样还是方便的。否则就会增大误差。 (4)系统抽样 系统抽样(也称等距抽样):将总体N个单位按某 种顺序排列,按规则确定一个随机起点,再每隔一 定间隔逐个抽取样本单位的抽样方法。 直线等距抽样: 将总体分成n个组,每组有 k=N/n个单位。 在第一组随机选择一个单位,之后每隔k个选择一个。 非概率抽样 方便抽样:选择容易接触的个体作为调查研究对象 判断抽样:根据研究者的判断,选择“有代表性”或“典型性”的样本单位;

文档评论(0)

fpiaovxingl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档