- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样的逻辑
第三讲抽样的逻辑 参数值 概率抽样(Probability Sampling) 简单随机抽样(Simple Random Sampling) 方法:抛硬币、掷骰子、抽签、查随机数表等。 3. 分层抽样(Stratified Sampling) a. 等比例抽样 要求各层之间的抽样比例相等。 方法1:先分成不同的层,然后采取系统抽样或者随机抽样按照比例抽取。 方法2. 分类,再把不同类别的要素放到一个连续性的列表中,然后再对整个列表进行随机开始的系统抽样。(误差将会在1-2个以内,如果在此步采取简单随机抽样将会使分层的效应被抵消) b. 不等比例抽样,加权 即各层之间的抽样比例不等: 有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行比较研究。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 4. 整群抽样(Cluster Sampling) 5.多阶段抽样(Multi Stage Sampling) 亦称多级抽样,在上述整群抽样中,当子群或子群内部个体数目较多,彼此间的差异不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是从中再抽取样本,因最终样本的获得经过两次抽样,我们称其为二阶段抽样。同样可进行三阶段、四阶段等多阶段抽样。 如:我们若要调查北京市小学生的视力状况,可采用三阶段抽样的方法:先以学校为抽样单位,抽出若干所小学,然后再以班级为抽样单位抽出若干班级,最后以学生个人为单位从抽中的班级中抽取最终样本。 多阶段抽样 例:在一项某市居民对香皂颜色喜好的调查中,设计者打算采用入户调查的方式,为节省差旅费,希望样本能够集中,因此准备采用整群抽样。方案设计者手头有份该市街道名单。以街道作为群,工作量太大,以居委会为群,编制抽样框来不及,因此,他决定………… 优点:效率较高 局限性:每一阶段都会有误差。 适用范围:跨地区的研究,不可能或不方便编制一个完整的名单形成目标总体时;或者是在总体层次比较多或层次内单位数目比较多时,更加经济实用。 要点 概率抽样: 1 .样本较具代表性;2.概率理论能够让我们估计样本的精确度和代表性。3. 尤其适用于从大的、已知总体中抽取样本;4. 适用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以及人口分布的研究等。但在概率抽样时要特别注意控制调查过程中的非抽样误差。 謝謝大家…. * * 讲解: 李素梅 总体与抽样框 概率抽样的应用 概率抽样的实际操作 抽样:从总体中选出具有代表性样本的过程。以便通过对样本的研究,取得能说明总体的足够可靠的资料,准确地推断总体的情况,从而认识总体的特征或规律性。 从样本的特征推断总体的特征 统计值 本样 总体 抽样原则:样本具有代表性,即所选取的样本能再现总体的结构。 总体 研究总体 抽样框 样本 推论的对象 抽样的对象 抽样的名单 抽到的对象 回顾几个概念吧 影响样本代表性的因素 样本容量 抽样方法 抽样框、总体是否一致等 抽样框与总体的关系:经过正确抽样所得的样本信息,只适合于描述构成抽样框的要素组成的总体,是否能扩展需要分析。 例:对纽约以及新泽西48个社区中68个药房药物的销售情况进行25年的调查(方法:“调查邻近药房的方式”)----能推断整个美国药房销售的情况吗?或是否能推论纽约和新泽西的药房的情况? 理想的抽样框:所有的抽样单位必须覆盖总体,抽样框要求每个总体单位都应该对应着一个抽样单位,抽样单位必须相互独立,互不重叠。如以北京的所有街道的名单为一阶抽样中的抽样框,其必须覆盖北京所有的街道。 最理想的抽 样框 随机抽取 成员 组织如学校等 成员 抽样框表现形式----例:电话号码簿、邮政编码簿、车主名单、纳税人名单、领有营业执照的人员名单;大学、学术期刊、报纸、工会等名单 当你用电话簿或名册作为抽样框时,有没有注意它是否包含了总体所有单位呢? 抽样框误差来源于:1. 不能覆盖总体单位; 2 . 包含了非总体单位; 3 . 复合联接; 4 . 抽样框老化。 非概率抽样方法 就近法、目标式抽样、 配額抽样、滾雪球抽样 确定合适的样本量 执行抽样设计 界定总体 决定抽样框 确定抽样步骤 概率抽样方法 简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样 概率抽样 系统抽样 简单随机抽样 分层抽样 整群抽样
您可能关注的文档
- 打击地球人专用图.doc
- 打印机皮带驱动系统.ppt
- 打孔机生产效率全方位提高_数学建模.doc
- 打印机维修技术.ppt
- 才女—蔡文姬--优秀Ppt.pptx
- 打造高效外贸团队.ppt
- 托县蒙丰消防报建说明5.22.doc
- 托尔曼的认知行为.ppt
- 托马斯·杨的光干涉实验.ppt
- 打造公安消防铁军比武竞赛项目及操作规程.doc
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)