第六周第六章抽样.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六周第六章抽样

第六章 抽样 第一节 抽样的意义与作用 一、与抽样相关的概念 抽样调查就是从研究对象的总体中选择一部分代表加以调查研究,然后用所得的结果推论总体特征,从总体中选取部分代表的过程就是抽样,所选取的这一部分代表就称为样本。 抽样调查的理论依据:部分包含于整体之中,部分与整体有同样的特征、关系及过程。 抽样调查的成功与否首先要求所选取的样本能够代表总体, 既所抽取出来的样本的总特征能够再现总体的结构。 为了更好的理解抽样的概念,我们将其与其他一些相关的概念同时进行介绍。 1、总体(population) 总体通常与构成它的元素(element)共同定义;总体是构成它的所有元素的集合而元素则是构成总体的最基本单位。比如我们调查运城学院大学生的择业倾向,则运城学院每一个的在校大学生便是构成总体的元素,而学院所有在校大学生的集合就是调查的总体。一个总体中所包含元素的数目通常用大写字母N表示。 2、样本(Sample) 样本就是从总体中按一定方式抽取出的一部分元素的集合。如从某省总数为12.8万的大学生总体中,按一定方式抽取出1000名大学生进行调查,这1000名大学生就构成该总体的一个样本。(当然,从一个总体中可以抽取出若干个不同的样本)。样本中的元素数目通常用小写字母n表示, 3、抽样(Sampling) 抽样是指从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。比如从10000名运城学院的学生中抽出100名学生的过程就是抽样。 4、抽样单位(Sampling Unit) 抽样单位就是一次直接的抽样所使用的基本单位。抽样单位有时与构成总体的元素是相同的,有时是不同的。比如,从运城学院10000名学生中直接抽出100名学生,这时,单个的学生既是构成运城学院10000名大学生这一总体的元素,又是我们从总体中抽取100名学生的样本时所使用的抽样单位。但是,当我们一次从这一总体中抽出10个班,而以这10个班级中全部学生(假定正好100名)作为我们的调查样本时,抽样单位(班级)与构成总体的元素(学生)就不是一样的了。 5、抽样框(Sampling Frame) 抽样框也叫抽样范围,是指一次抽样时总体中所有抽样单位的名单.比如,从运城学院全体学生中抽取100名学生作为调查样本,那么,运城学院的全体学生的名单就是这次抽样的抽样框;如果是抽取部分班级作为调查样本,那此时的抽样框就不是全校学生的名单,而是全校所有班级的名单了。 6、参数值(Parameter) 也称总体值,它是关于总体中某一变量的综合描述。或者说是总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是总体某一变量的平均数, 比如,运城学院大一学生的平均年龄等。需要注意的是,参数值只有对总体中的每一个元素都进行调查或测量才能得到. 7、统计值(Statistic) 统计值也称为样本值,它是关于样本中某一变量的综合描述.或者说是样本中所有元素的某种特征的综合数量表现.统计值是从样本中计算出来的,它是相应的参数值的估计量。 比如样本平均数是通过调查样本中的每一个元素后计算出来的,它是总体平均数的估计量。二者是一一对应的。按照习惯,参数值通常以希腊字母表示,而统计值通常以罗马字母表示,如,总体平均数用μ表示,而样本平均数则用 ̄X表示。又如总体标准差用δ表示,而样本标准差用S表示。 参数值和统计值之间的区别是,参数值是固定不变的,唯一的,并且通常是未知的,而统计值则是变化的,即对于同一个总体来说,不同样本所得的统计值是有差别的,同时对于任一特定的样本来说统计值是已知的,或者说是可以通过计算得到的,从样本的统计值来推论总体的参数值,正是社会调查的一项重要内容. 8、置信度(Confidence level) 置信度也称为置信水平,它是指总体参数值,落在样本统计值某一区间内的概率,或者说是总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。比如,置信度为95%,指的是总体参数值落在样本统计值某一区间的概率为95%,或者说,我们有95%的把握认为总体参数值将落在样本统计值周围某一区间内。 9、置信区间 (Confidence Interval) 上面所说的“某一区间”,就是置信区间。它指的是在一定的置信度下,样本统计值与总体参数值之间的误差范围。置信区间反映的是抽样的精确性程度。 比如,从某一机关一万名干部中抽取200人为样本,调查其平均工资,若样本的平均工资为100元,那么总体平均工资落在95-105元这一区间的概率可能为96%(误差为±5元),落在90-110元这一区间的概率可能为99%(误差为±10元)可见,置信区间越大,既

文档评论(0)

zilaiye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档