定量研究方法与建模第三章-15年.ppt

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
定量研究方法与建模第三章-15年要点

* 2)推断的把握性与精确性 在社会调查中,我们用置信度和置信区间来说明样本规模与抽样的可靠性与精确性之间的关系。 一般说来,在其他条件一定的情况下,置信度越高,即推论的可靠性越大,则要求大样本规模就越大。 99%的置信度所要求的样本规模比95%的置信度所要求的样本规模大。 * 在其他条件一定的情况下,置信区间越小,即样本统计值与总体参数之间的误差范围越小,则所要求的样本规模就越大。 比如,对总数为20000的总体,要求置信区间为±5%,则需要了解377个回答者,若要求置信区间为±4%,则需要583个回答者,当要求置信区间为±1%时,则需要6849个回答者。 * 3)总体的异质性程度 总体成员相互不存在区别时,只要了解其中之一就可以了。 一般来说,要达到同样的精确性,在同质性高的总体中抽样时,所需要的样本规模就小一些;而在异质性高的总体中抽样时,所需的样本规模就大一些。 同质性越高,表明总体在各种变量上分布越集中,波动性越小,同样规模的样本对总体的反映就越准确。 异质性越高,表明总体在各个变量上的分布越分散,波动性越大,同样规模大样本对总体的反映就越差。 * 4)研究者所拥有的经费、人力和时间 从样本的代表性和精确性考虑,当然样本规模越大越好。 但样本规模越大,意味着调查所需要投入的人力、物力和时间越多,意味着调查所可能受到的限制和障碍也越多。 从调查的可行性、简便性考虑,样本规模又是越小越好。 究竟需要多大的样本,需要调查根据实际情况作出选择。 * 3 样本规模与抽样误差 抽样误差就是样本的统计量与总体的参数值之间的误差。 它是由抽样本身的随机性所引起的误差。 无论采取什么样的抽样方式,抽样误差都是不可避免的。 * 抽样误差的决定因素 抽样误差主要取决于总体的分布方差和抽样规模,这两个因素都可以导致抽样误差的增加或减少。 当样本规模增加时,样本统计量的随机波动程度就会降低,从而使抽样误差也减少。 * 在简单随机抽样中,人们正是以扩大样本规模的方式来减少抽样误差的目的。 而分层抽样则是着眼于缩小总体的异质性程度或分布的方差。 * 概率抽样的原理与程序 抽样分布 * 概率抽样的原理与程序 抽样分布 * 概率抽样的原理与程序 抽样分布 * 概率抽样的原理与程序 抽样分布 * 概率抽样的原理与程序 抽样分布 当样本容量继续增大(越来越接近总体的1/2时),样本平均数的分布会进一步发生变化。这种变化趋势是:平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显. “中心极限定理” 当n足够大时(通常假定大于30),无论总体的分布如何其样本平均数所构成的分布都趋于正态分布。 * 简单随机抽样( SRS ) 简单随机抽样是一种一步抽样法,它保证样本量为 n 的每个可能的样本都有相同的被抽中的概率 p=n/N 。简单随机抽样又称纯随机抽样,就是按照随机原则从总体各单位中直接抽取样本。 是所有概率抽样的出发点和理论基础。 常用方法有: (1)直接抽样法,就是从总体各单位中直接抽取样本的方法。 (2)抽签方法或抓阄方法 (3)随机数表法 * 利用随机数进行抽样的步骤: 1)先取得总体中所有元素的名单(即抽样框); 2)将总体中所有元素一一按顺序编号; 3)根据总体规模是几位数来确定从随机数表中选几位数码; 4)以总体规模为标准,对随机数表中的逐一进行衡量并决定取舍; 5)根据样本规模的要求选择出足够的数码个数; 6)依据从随机数表中选出的数码,到抽样框中去找它对应的元素。 例 总体共3000人(4位数),需要从中抽取100个人作为样本 假设选择下表所示的五位随机数表 随机数表中的数码 选用的数码 不选用的原因 90906 0906 73020 后四位大于3000 10041 0041 22507 2507 04310 后四位大于3000 66042 后四位大于3000 12683 2683 82507 与所选的第三个数码重复 51176 1176 * 优点: 在抽样过程中完全排除了主观因素的干扰,简单,易行,只要有总体各单位名单就行。 缺点: 只适应总体单位数量不大的调查,如果总体单位多,则编制抽样框的工作量太大; 抽样误差大; 样本可能比较分散或过分集中,会给调查带来困难。 * (二)等距随机抽样(系统抽样( SYS ) 等距随机抽样又称机械随机抽样或系统随机抽样,就是先编制抽样框,将各抽样单位按一定标志排列编号;然后,用总体单位数除以样本单位数求得抽样间隔,并在第一抽样间隔内随机抽取一个号码作为第一个样本;最后,按抽样间隔等距抽样,直到抽取最后一个样本为止。 它需要一个抽样间距和一个随机起点。抽样间距是 k=N/n ,随机起点 r

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档