- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【2017年整理】14样本容量的确定
;;1.概率抽样中样本容量的确定;1.可支配预算
例如:一个品牌经理如果有40000美元预算可用于某项市场研究,那么除去其他项目成本(如调查方案和问卷的设计数据的处理分析等)后,余下的那部分预算才决定着被调查的样本容量的大小。如果可支配资金太少,可以确定的样本量太小,管理者就必须做出决策是补充更多的资金还是放弃这一项目。
;2.经验法则
“一种强烈的感觉”,认为某一特定的样本容量是必要的或合适的。
以“经验性”为幌子,认为样本容量应该是“为保证精度,一般至少应该是总体的5%”
例如关于鞋子的调查:1万名铁人三项运动员;耐克对“飞人乔丹”进行调查,200万名潜在的篮球鞋购买者
简单易行,但不是一种高效率、经济的方法,经验法则方法忽略了抽样的精确度问题。
;3.拟分析的“子群数”
子群数:总体样本的各个子群体的数目
在其他条件相同的情况下,所要分析的子群数目越大,所需的总样本容量也就越大,一般认为样本量要足够大,以便每个子群的容量至少为100 而每个次子群的容量至少也有20-50。
;例如:从整体上看样本容量为400很符合要求,但若要分别分析男性和女性被调查者,并且要求男性与女性的样本各占一半,那么每个子群的容量仅为 200 。这个数字是否符合要求,能使分析人员对两组的特征做出预期的统计推断吗?再如,要按年龄和性别分析调研结果,问题就变得更复杂了。假设要按以下方式将总体样本划分为四组:
35岁以下男性
35岁以上男性
35岁以下女性
35岁以上女性
如果预计每组约占样本的25%,那么子群容量仅有100。随着样本容量的缩小,抽样误差增加,会出现这样一个问题,那就是调研人员很难辨别依据现象所得到的两组间的差别是真正意义上的差别还是由于抽样误差引起的差别。;4.传统的统计方法
总体标准差的估计值
抽样的允许误差范围
抽样结果在实际总体值的特定范围(抽样结果+(-)抽样误差)内的置信水平;;如果多数回答都接近于同一个数字,而且大多数的回答者都集中在某一小范围内,则差异性小;反之,则差异性就大 ;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.;差异性
差异性的基本概念就是指回答的相似程度。差异性小意味着回答相当相似,差异性大表示回答很不相似。
如果答案曲线图显示十分集中或呈“尖峰”状态,则差异性小。如果曲线图显示受访者在各种可能的答案选项间平均分布,则差异性大。
测量差异性的指标——标准差;将两个样本的标准差进行比较,以判定相关的差异性。 ;比较两个图形,可以得出结论:
在1955年汽车拥有者的驾驶里程较少(平均),而且差异性也不大(标淮差),但现在的车主们年平均驾驶里程较多,差异性也较大。 ;正态分布的特征(根据以上图形)
正态分布呈钟形且只有一个众数
关于均值对称,集中趋势的三个衡量标准(平均数、众数、中位数)相等
一个正态分布的特殊性由其均值和标准差决定
正态曲线下方的面积等于1,它包括了所有观测值;5.正态曲线下方任意两个变量值之间的面积,等于在这一范围内随机抽取一个观察对象的概率
6.在均值的给定比例标准差范围内的概率为固定值。即所有的正态分布在平均数+-1个标准差之间的面积相同,都占曲线下方面积的68.26%,或者说占全部调查总体结果的68.26%。这叫正态分布的比例性。;x;标准正态分布
任何正态分布都可以转化为标准正态分布
均值等于0
标准差等于1;正态分布的任一变量值X通过一个简单的转化公式就能变成相应的标准正态分布中的Z值
其中X是变量值,μ是变量平均值,σ是变量标准差
;总体分布:是总体中全部单位的频率分布,这一频率分布的平均数,通常用希腊字母μ表示,标准差用希腊字母σ表示
样本分布:是单个样本中所有单位的频率分布,样本分布的平均数常用 表示,标准差用S表示;样本平均数的抽样分布:是指从一个总体中抽取一定数量的样本,由样本平均数构成的概率分布。
首先,要从特定的总体中抽取一定的样本,计算各样本的平均数,并排列出频率分布
每个样本由样本单位数不同的子集构成,因此,样本平均数不会完全相同;如果样本是随机的且容量足够大,则样本均值的分布近似于正态分布
理论基础是中心极限定理:随着样本容量的增加,从任一总体中抽取的大量随机样本平均数的分布接近服从正态分布。
其均值为 ? ,且标准差等于:
n为样本容量, ?为总体的标准差;平均数的标准误差:实际总体值与所预期的典型样本结果的差距。
平均数标准误差,即样本均值的标准差(抽样误差)。
由于总体标准差?是未知的,一般由样本标准差s代替。
例如:驾驶里程调查中,样本容量n是100名驾驶
文档评论(0)