网站大量收购独家精品文档,联系QQ:2885784924

统计学数据的收集.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1记录学

Statistics

2第2章数据的搜集2.1数据搜集的重要措施2.2几种基本的抽样措施2.3数据搜集的误差2.4小结

3第2章数据的搜集2.1数据搜集的重要措施

4数据搜集的重要措施根据研究的目的和规定,采用科学的措施,有组织、有计划地搜集数据信息资料的过程,称之为记录调查(statisticalsurvey)。实践中,数据来源一般有两个重要渠道:一是直接进行调查或试验,获得“一手数据”;二是通过他人调查或试验的成果整顿得到“二手数据”。

5数据搜集的重要措施在社会经济领域,专门调查是直接获取数据的重要手段,包括了一国政府组织的多种普查、抽样调查、记录报表制度等,也包括了企业、机构、部门甚至个人为了特定目的而进行的多种市场调查、产品测试、民意调研等。调查数据一般是客观上已经存在的,但需要通过观测或问询的方式才能搜集汇总得到。显然,调查数据大多与时间有关,是特定期期或时点上的变量成果,因此,此类数据也会伴随时间的变化而变化,理论上无法反复观测。

6数据搜集的重要措施此外,调查的对象一般以人为主体,虽然调查对象是其他的客观事物(如一块土地),调查的成果(如产量)也往往与人的活动有关。这就使得要搜集高质量的调查数据,必须将人为原因的干扰尽量控制在最低程度,而这也恰恰是搜集调查数据的难点所在。科学试验则是搜集自然科学数据的常用手段。与调查数据不一样,试验数据是在控制一种或多种原因的前提下,观测感爱好的变量成果,试验的次数也可以是无限的,并且可以通过变化控制原因,观测变量成果的变化状况。

7数据搜集的重要措施相较于专门调查,通过科学试验搜集数据在一定程度上能更为有效地控制数据质量,但也愈加专业,受到的技术甚至法律、道德等原因的制约更多,从而应用的领域不及专门调查广泛。值得一提的是,伴随计算机技术和电子商务的迅速发展,诸多数据被自动搜集保留到特定的数据库当中,成为当今“大数据”的重要来源。假如可以根据研究目的,“量身定制”调查或试验方案,直接搜集“一手数据”,当然是最佳的。但对于大多数使用者来说,受各方面原因的限制,设计、实行一项调查或试验往往是不太现实的,可以获得的数据量也较为有限。因此,人们更多的是通过搜集整顿他人调查或试验的成果来间接获取“二手数据”。

8数据搜集的重要措施政府、企业、机构等公开出版或公布的数据,各类媒体公开报道的数据,都是十分重要的间接数据来源。对于使用者来说,“二手数据”的搜集显然愈加紧捷、经济而便利,并且可以突破直接数据搜集在时间上的约束,观测变量在较长一段时期内的变化趋势。不过,需要注意的是,由于“二手数据”是他人调查或试验的成果,并非根据使用者自身的研究目的设计、实行的,很难完全吻合使用者的研究需要,因此,对于数据的筛选、检查、核算等预处理工作就显得尤为重要,防止误用或滥用。

9第2章数据的搜集2.2几种基本的抽样措施

10几种基本的抽样措施假如在抽样的过程中,总体中的每个个体均有一种已知的机会(概率)被选中,那么根据这样的抽样方案得到的样本就是一种随机样本(randomsample)。按照一定的概率,根据随机原则从总体中抽取部分单元的抽样措施就称为随机抽样(randomsampling)或概率抽样(probabilitysampling)。随机抽样最重要的长处是,由于每个总体单元都是随机抽取的,并且可以计算出每个单元被抽中的概率,因此可以计算出数据搜集过程中的抽样误差,从而得到样本估计成果的可靠程度。

11几种基本的抽样措施假设总体一共有N个单元,从中随机地抽取n个单元构成最终的样本,并且总体中每个单元被抽中的概率是相等的,这就是简朴随机抽样(simplerandomsampling)。采用简朴随机抽样时,假如每抽取一种单元记录下数据后,再把这个单元放回到本来的总体中参与下一次的抽选,称为有放回抽样或反复抽样(samplingwithreplacement)。假如被抽中的单元不再放回到总体中,每次抽样都仅从剩余的单元中随机抽取,就称为无放回抽样或不反复抽样(samplingwithoutreplacement)。

12几种基本的抽样措施简朴随机抽样是一种最基本的概率抽样措施,也是其他抽样措施的基础。这种措施简朴直观,尤其在计算机技术发达的今天,可以以便地运用计算机从总体中抽取简朴随机样本。不过,简朴随机抽样在实际应用时也存在某些局限性。首先,要获得包括总体所有单元的名单也许是不现实的;另一方面,假如总体单元某方面的特性(如性别)有也许对研究变量(如身高)产生影响,抽样时就需要借助这些辅助信息合理安排样本构成比例,提高估计的效率。因此,根据研究问题和研究对象的不一样,人们往往会将简朴随机抽样与其他抽样措施结

文档评论(0)

159****1748 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档