网站大量收购闲置独家精品文档,联系QQ:2885784924

统计基础九:抽样及样本容量.pptx

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样及样本容量(Sampling Sample Size)什么是抽样及为何要进行抽样?抽样是收集所有数据的一部分。使用该部分数据得出结论(进行推论)。为什么要进行抽样?因为查看所有数据可能成本太高。费时太长。造成破坏(例如、品尝测试)。一般可从比较少量的数据得出可靠的结论。使用样本对总体进行推论:例如。平均值 = X、比例 = p总体和过程总体情况:在操作上您可以定义现存的总体的边界、以便可以认出 总体的每个个体、在理论上还可以进行编号。抽样目的: 描述该总体的特征。 示例:抽样调查(8 月 31 日以前毕业的)大学校友、以确定 在今后两年中他们至少将一个小孩送进大学的百分比。样本抽样数据的时间曲线图以时间顺序排列的过程输出使用样本对过程未来的行为进行推论?20%昨天今天明天15%???10%?5%保存时间顺序!总体和过程(续)过程情况:过程是动态的且不断变化的;过程中的个体并不是全可以鉴定的、 因为某些个体尚不存在(如明天制造的那些个体)。 目的:了解过程、以便采取行动改进或预测过程未来的行为。示例:我们估计下月发票中有 5% 至 20% 有错误(除非更改该过程)。抽样和改进项目改进项目一般是对过程情况进行抽样: 确定过程周期和缺陷比率的基准性能; (例如:在控制图上绘出样本数据)估计过程能力; (例如:计算一件样本中的缺陷)确定造成性能低下或数据变动的因素 (X); (利用样本数据绘制图表、进行假设测试或回归分析)验证建议的改进工作; (比较从过程中抽取的新数据与从该过程抽取的旧数据)监视过程性能、必要时采取补救措施、并预测未来的性能; (在控制图上绘出新过程的样本数据)为什么要区别总体抽样和过程抽样?样本容量公式是为定义明确的静态(而且常常是理论上的) 总体情况设计的。但是大多数抽样应用是针对动态的、尚未知的过程情况。将样本容量公式应用于过程抽样情况可能得出错误的结论、 除非满足一定的条件。要使推论有效、样本必须真实地代表总体或过程。总体所需的抽样策略不同于过程所需的抽样策略、 以确保样本具有代表性(在下一节中讨论)。(稳定的、可预测的过程)6560555045401357911131517192123252729313335373941从稳定的过程中抽样如果过程是稳定的、样本容量公式可应用于过程情况。可获得具有特定精度的可靠估计值。当进行比较时、如果存在的差异具有一定功效、便可找出它们。从不稳定的过程中抽样然而许多过程是不稳定的。无论如何总要收集数据、并绘制控制图或时间曲线图。识别特殊原因并清除之。使用样本容量公式求出的值是您应认为最小的数字; 可能的话,需要收集更多的数据。存在特殊原因时,需要更大的样本容量,因为长期变动大于短期变异。使用公式时,您必须估计s(或 p);您必须判断特殊原因如何 影响该估计值,并根据您认为过程将会是什么情况来调整它。从不稳定的过程中抽样(续)当进行组之间的比较时:尽量在相同时间内获取每组的样本。当作结论或报告结论时、会存在这样一个风险、即这些结论可能 不适用于将来。如果过程是不稳定的,可能的话,将一段很长的时间里得到的数据 绘制于一张控制图上,并圈出或特别标示您的样本所代表的数据点 或时间区间。允许您和他人可直接从曲线观察过程的行为。帮助您判断这些结论在未来的可靠性。从过程中抽样对于过程情况,我们希望确保能够理解过程的行为。因此我们:在一段时间内进行系统或整群(非随机)抽样。即使随机抽样能适用于稳定过程,我们仍采用系统或整群抽样,并保持时间顺序 以便能更好地表示过程行为。尽量从足够长的时间段中进行抽样,以便真实地表示过程中的变化源。运用您自己的判断和有关变化源的过程知识来确定多长时间进行一次抽样 (每隔 10 个个体、每隔 7 个个体、每天、每月等)。一般情况下、更加频繁地收集小样本、可确保随着时间的过去能真实地表示过程行为。绘制控制图或时间曲线图,以确定该过程是稳定的还是不稳定的(寻找非正常值、偏移、趋势或其它模式)。抽样方法代表性样本要使结论有效,样本必须具有代表性。数据应真实地表示总体或过程收集的数据与未收集的数据之间不应存在有系统性的差异。概率抽样随机 抽样分层随机抽样总体样本每个单元具有相同被选中的机会从每个组随机抽样一个成比例的数字总体样本BABBABBABBBAAABBBBCDDDDDDCDDDC总体或过程样本保持时间顺序过程样本9:009:3010:0010:30保持时间顺序系统 抽样整群 抽样每隔 n 个抽样(如每隔三个抽样)每经过时间 t 抽样 n 个单元(例如,每小时抽样三个单元);然后计算每个小组的平均值 (比例)抽样误差 统计调查的误差(抽样误差):是指调查所得结果与总体真实数值之间的差异。 可分 1、登记性误差:指在调查和汇总过程中,由于观察、测量、登记、计

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档