市场调查与分析第十二章 抽样估计与样本容量确定.ppt

市场调查与分析第十二章 抽样估计与样本容量确定.ppt

第十二章;抽样估计的基本思路;;一、正态分布——重要的统计分布 正态分布是一种钟形的、相对于其平均值对称的连续性分布。正态分布的统计特征在于: 1.只有一个众数。 2.相对于其平均值对称。 3. 正态分布由其平均值和标准差唯一确定。 4.正态分布曲线下方的总面积等于1,正态分布曲线下任意两个变量值之间的区域面积等于观察值处于这两个变量值之间的概率。 5.任何正态分布都可以通过简单的转化,变为标准正态分布。其转化公式为; ;正态分布在统计推断中处于特别重要的地位。原因在于: 1.许多变量的概率分布都接近正态分布,如消费者消费掉的软饮料数量、爱吃快餐的人平均每月去快餐店的次数等。 2.正态分布在理论上重要,根据中心极限定理,任何总体不论其分布如何,随着样本容量的增加,样本均值趋近于正态分布 3.许多离散性概率分布也近似于正态分布。 ;总体分布、样本分布和抽样分布;总体的分布、样本分布可能不一定是正态分布,但是根据中心极限定理,样本平均值的抽样分布必定是正态分布。 对于正态分布来说 管的是曲线的位置, 管的是曲线的胖瘦。 不同的样本量确定的样本平均值抽样分布其 和 不同,所以对于规定的置信区间来说,大样本的平均值的抽样分布更“集中”,误差也小;从另一方面,如果误差确定,大样本的平均值的置信度更高。;计算总体均值的区间估计,就是想获得样本均值抽样分布的 和 ,从而根据置信度确定置信区间,然后在点估计的基础上确定区间估计。 例:从一个500人的总体中,采用简单随机抽样抽出一个10人的样本,每个入样单元的年龄见下表。求平均年龄估计值的抽样方差、标准差,并计算在95% 的置信水平下的误差限于相应的置信区间。;样本单元; 1.计算点估计值: =(21+26+……+47)/10=34.4 2.计算抽样方差的估计值: 计算每个人的年龄与其平均数的差;计算离差的平方;以离差的平方和除以样本量减1的值作为总体方差的估计值(64.27);以总体方差的估计值处以样本量得到抽样方差的估计值(6.4)。 3.标准差为抽样方差的平方根(2.5) 4.95%置信度下的误差限为1.96*2.5=4.9 5.置信区间为???34.4-4.9,34.4+4.9)即(29.5,39.3);样本量的确定;样本容量;;影响样本容量的因素;给定均值精度,计算简单随机抽样样本量;;;在通常情况下,总体规模比较大,则可以将以上计算公式简化为: 如果使用的不是简单随机抽样,则可以通过设计系数调整样本量。 如果回答率小于100%,也可以对回答率进行调整。;给定估计比率精度,计算简单随机抽样样本量;如果总体N很大,则计算公式可以简化为: 容易观察到当P=0.5时,总体方差存在最大值。因此在计算样本量时,如果总体方差未知,可以从统计稳健性出发算出一个保守的样本量。;例:某杂志出版商希望得到读者对该杂志综合满意度的估计值。通过邮寄调查,出版商可以联系到所有2500个订户,但由于时间限制,出版商决定使用简单随机抽样进行电话调查。出版商希望真实总体比例落在总体比例的样本估计值的正负0.1范围内;希望估计值的置信度为0.95;预计回答率为65%。则:请计算样本量。;解析:由于事先没有顾客满意度的估计比例,因此为留有余地,访查应取最大值,即P=0.5。 计算出样本量为n1=92 由于采用简单随机抽样所以不需要经过设计调整 进行无回答调整得n=92/0.65=142;决定样本规模的“信息价值”法;1.为什么信息有价值;2.信息价值和样本规模

文档评论(0)

1亿VIP精品文档

相关文档