- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分层随机抽样样本量的估算
第十五章 总体特征抽样调查的 设计与分析 主要内容 单纯随机抽样 系统抽样 分层随机抽样 第一节 单纯随机抽样 例15-1 某地区共有250名社区医生,一个研究组从名单中随机抽取90名进行调查,发现他们一个月内家访平均次数为4.89,标准差为3.48;其中有40位是医科大学毕业。试估计当地一个月内平均每位社区医生的家访平均次数、全体社区医生的家访总次数以及社区医生中大学毕业者所占的百分比。 单纯随机抽样 单纯随机抽样(simple random sampling)。 一个月内平均每位社区医生家访的平均次数约为4.89 全体社区医生家访的总次数约为4.89×250=1222.5 社区医生中大学毕业者所占的百分比约为(40/90)×100%=44.4% 单纯随机抽样 连续型变量总体均数的估计 无限总体(infinite population) 从正态分布总体 ,则样本均数的标准误为 总体均数 u 的可信区间 单纯随机抽样 有限总体(finite population) 样本均数的标准误: 可信区间: 单纯随机抽样 例15-1 : 总体均数u的95%置信区间: 单纯随机抽样 总体中所有X值之和的置信区间可以用u的置信区间乘以N倍来估计,即 全体社区医生一个月内家访总次数的95%置信区间 : 单纯随机抽样 0-1变量总体概率的估计 二项分布无限总体: 已知在含有n个个体的独立随机样本中,有y个个体具有某种特定属性,则该属性的样本频率 样本频率变异性的标准误 : 单纯随机抽样 有限总体 : 总体概率的置信区间 : 单纯随机抽样 例15-1: 当地全体社区医生一个月内家访的总次数约介于1077.5和 1367.5之间,平均每位社区医生家访的平均次数约介于4.31和5.47之间;而社区医生中,大学毕业者所占的百分比则约介于36.2%和52.6%之间。 单纯随机抽样 样本量的估算 样本量估算的依据 样本量的信息: 1.总体中个体的变异程度 如果个体间变异程度小,则所需样本量也较少;通常用变异系数V来反映个体间变异。 2.精度 通常用最大的相对误差反映精度的要求,是最终估计范围的半宽度与真值之比。精度要求越高,样本含量就越大。 3.置信程度 即置信水平反映置信程度。置信程度越高要求的样本含量也越大。 单纯随机抽样 连续型变量总体均数估计的样本量 需准备如下信息: 1.变异系数V 即总体标准差与总体均数之比 2.相对误差 由研究者根据问题的背景自行规定。 3.置信水平 也由研究者根据问题的背景自行规定。通常取90%,95%,99%。如果取99.7%,理论上认为这时的置信区间基本上覆盖真值,所以称之为“实质上肯定”(virtual certainty)的水平,此时标准正态分布的临界值 单纯随机抽样 最小样本量的公式为 续例15-1,将已获得的90名社区医生的资料视为预调查 单纯随机抽样 关于社区医生家访次数的估计,欲使相对误差不超过20%,而保持置信水平为95%,至少需要调查49名社区医生。比由此,为了估计平均家访次数,预调查90名社区医生的资料已经足够了。还少? 需要说明的是,如果算出的最小样本量n超过了总体内个体数N,则最小样本量就应该是N,即需要作全数调查。 单纯随机抽样 0-1变量总体概率估计的样本量 事先需知 (1)总体概率的猜测值P 可以通过预调查的资料来粗略估计。 (2)相对误差 由研究者根据问题的背景自行规定。 (3)置信水平 也由研究者根据问题的背景自行规定 概率的变异系数的计算公式为 最小样本量的公式为 关于社区医生中大学毕业者所占百分比的估计,欲使相对误差不超过20%,而保持置信水平95%,至少需要调查121名社区医生。 系统抽样 系统抽样需要事先为总体中的个体编号。 如果欲调查的变量值或特定的属性与编号之间没有确定的上升、下降或周期性关系,这时可以按单纯随机抽样的办法来估计参数和估算样本量。 如果个体的编号不具有随机性,就应考虑采用其它的抽样设计和相应的统计方法。 第二节 分层随机抽样 例15-2 欲抽样调查某医院病人的药费开支和自费病人所占频率。决定将病人分为内科、外科、妇科、儿科和其他5个“层”;将每一层视为一个小总体,在每一层内作随机抽样 。 已知一天内5个层的门诊人次数分别:N1=2800,N2=900,N3=700,N4=400,N5=200, 总的人次数n=5000,总的样本数n=1000,抽样的比例为n/N=0.2。于是,5个“层”中抽出的样本量分别:n1=560,n2=180,n3=140,n
文档评论(0)