两个总体比例的区间估计(传统方法) * 解: 已知 n1=500 ,n2=400, p1=45%, p2=32%, 1-? =95%, z?/2=1.96 P1-P 2置信度为95%的置信区间为 城市与农村收视率差值的置信区间为6.68%~19.32% 两个总体比例的区间估计(现代方法) * 通过修正试验次数n1、 n2(样本量)和试验成功的比例p1、 p2(样本比例)改进置信区间 将试验次数n1和n2各加上2,即用 代n1, 代替n2;将试验成功的次数x1和x1各加上1,即用 代替p1,用 代替p2 对于任意大小的样本都可以使用该方法计算置信区间 两个总体比例的区间估计(现代方法) * 设两总体都服从二项分布,即X1~(n1,p1), X2~(n2,p2) 。x1为n1次独立伯努利试验成功的次数,p1为成功的概率,x2为n2次独立伯努利试验成功的次数,p2为成功的概率 定义 , ; , P1-P2在1-? 置信水平下的置信区间 该区间也称为Agresti-Caffo区间(由Alan Agresti和Brian Caffo给出,以其姓氏命名) 如果下限小于-1则用-1代替;如果上限大于1则用1代替 单个总体参数的区间估计(小结) * 总体参数 均值 比例 方差 大样本 小样本 大样本 ?2分布 ?2已知 ?2已知 Z分布 ?2未知 Z分布 Z分布 Z分布 ?2未知 t分布 两个总体参数的区间估计(小结) * 总体参数 均值差 比例差 方差比 独立大样本 独立小样本 匹配样本 独立大样本 ?12、?22已 ?12、?22未 Z分布 Z分布 ?12、?22已知 ?12、?22未知 Z分布 ?12=?22 ?12≠?22 正态总体 F分布 Z分布 t分布 t分布 t分布 * 样本容量的确定 估计单个总体均值时样本量的确定 * 估计总体均值时样本量n为 样本量n与总体方差?2、允许估计误差 、可靠性系数Z或t之间的关系为 与总体方差成正比 与允许估计误差的平方成反比 与可靠性系数成正比 样本量的圆整法则:当计算出的样本量不是整数时,将小数点后面的数值一律进位成整数,如24.68取25,24.32也取25等等 其中: 允许估计误差 估计单个总体均值时样本量的确定 * 【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,允许估计误差为400元,应抽取多大的样本量? 估计单个总体均值时样本量的确定 * 解: 已知? =2000, =400, 1-?=95%, z?/2=1.96 应抽取的样本量为 即应抽取97人作为样本 估计两个总体均值时样本量的确定 * 设n1和n2为来自两个总体的样本,并假定n1=n2 根据均值之差的区间估计公式可得两个样本的容量n为 估计两个总体均值时样本量的确定 * 【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班?12=90 ,普通班 ?22=120 。如果要求估计的误差范围不超过5分,在两个班应分别抽取多少名学生进行调查? 估计两个总体均值时样本量的确定 * 解: 已知?12=90,?22=120, =5, 1-?=95%, z?/2=1.96 即应抽取33人作为样本 估计单个总体比例时样本量的确定 * 根据比例区间估计公式可得样本量n为 的取值一般小于0.1 P未知时,可取使方差达到最大的值0.5 估计单个总体比例时样本量的确定 * 【例】根据以往的生产统计,某种产品的合格率约为90%,现要求估计误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本? 解:已知p=90%,?=0.05, z?/2=1.96, =5% 应抽取的样本量为 应抽取139个产品作为样本 估计两个总体比例时样本量的确定 * 设n1和n2为来自两个总体的样本,并假定n1=n2 根据比例之差的区间估计公式可得两个样本的容量n为 估计两个总体比例时样本量的确定 * 【例】一家瓶装饮料制造商想要估计顾客对一种新型饮料认知的广告效果。他在广告前和广告后分别从市场营销区各抽选一个消费者随机样本,并询问这些消费者是否听说过这种新型饮料。这位制造商想以10%的误差范围和95%的置信水平估计广告前后知道该新型饮料消费者的比例之差,他抽取的两
原创力文档

文档评论(0)