- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 2 章 数据的搜集 第2章 统计数据的搜集 2.1 统计数据的来源 2.2 调查方案设计 2.3 调查问卷设计 2.4 抽样调查 2.5 实验数据 2.6 数据的误差 学习目标 了解统计数据的来源 了解数据的搜集方法 掌握调查方案的设计内容与要求 掌握调查问卷及其设计技巧 了解抽样调查方法 了解收集数据的实验方法 了解数据误差及对数据的质量要求 概率抽样和非概率抽样 抽样方法 概率抽样(probability sampling) 也称随机抽样 特点 按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中 每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率 简单随机抽样(simple random sampling) 从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的 最基本的抽样方法,是其它抽样方法的基础 特点 简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 局限性 当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其它辅助信息以提高估计的效率 分层抽样(stratified sampling) 将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本 优点 保证样本的结构与总体的结构比较相近,从而提高估计的精度 组织实施调查方便 既可以对总体参数进行估计,也可以对各层的目标量进行估计 分层抽样 Stratified Sample 先按某种特征将总体分为互斥(Mutually Exclusive)且完备(Collectively Exhaustive)的组群 然后按照总体特征的比例对每一组群进行简单随机抽样,从而使样本具有同总体相似的特征结构 可提高抽样调查有效性 分层抽样 Stratified Sample 例如:对学生调查 1. 把学生总体分为组群 互斥且完备 根据某种共同特点 2. 在每一组中作简单随机抽样。样本中走读生与住宿生的比例与学校学生总体相同 整群抽样(cluster sampling) 将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查 特点 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便调查的实施 缺点是估计的精度较差 整群抽样 Cluster Sample 先对总体聚类 然后用简单随机抽样选类 最后对选中的类作普查或简单随机抽样调查 抽样较为有效 整群抽样 Cluster Sample 例如:对制造业集团公司经理的调查 1. 聚类:工厂是类而经理是元素 2. 随机选厂 3. 对选定的厂中的经理作普查或简单随机抽样 分层抽样和整群抽样的相同之处 都是先对总体中的群体再对个体进行操作 都不是完全随机地抽取样本,都涉及一定的规则:分层随机抽样涉及的规则是分层群体之间属性的差异,而整群随机抽样涉及的规则是子群体之间的相似 都能提高随机抽样的效率和改善随机抽样的结果 分层抽样和整群抽样的不同之处 操作的群体不同,分层抽样操作的是分层群体,而整群抽样操作的是子群体; 适用的总体不同,分层抽样适用于容易按属性差异进行群体划分的总体,而整群抽样适用于不容易按属性差异但容易按可见标志进行群体划分的总体。 系统抽样(systematic sampling) 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位 优点:操作简便,可提高估计的精度 缺点:对估计量方差的估计比较困难 系统(等距)抽样 Systematic Sample 例如k=20, 假定随机选取的起点为2,先将总体排序。 然后从总体中选取样点的序号为第2,第22,第42,…,依此类推可得到抽样样本。 等距抽样的优点 等距离抽样与简单随机抽样比较,可使中选单位比较均匀的分布在全及总体中,尤其当被研究现象的标志值的变异程度较大,而在实际工作中又不可能抽选更多的样本单位时,这种方法更为有效。 等距抽样的局限性 运用等距抽样的前提是要有全及总体每个单位的有关资料,特别是按有关标志排队时,往往要有较为详细具体的资料,这是一项非常复杂和细致的工作。 当抽选间隔和被调查对象本身的节奏性相重合时,就会影响调查的精度。 多阶段抽样(multi-stage sampling) 先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查 群是初级抽样单位,第二
文档评论(0)