- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.拟分析的“子群数” 子群数:总体样本的各个子群体的数目 在其他条件相同的情况下,所要分析的子群数目越大,所需的总样本容量也就越大,一般认为样本量要足够大,以便每个子群的容量至少为100 而每个次子群的容量至少也有20-50。 例如:从整体上看样本容量为400很符合要求,但若要分别分析男性和女性被调查者,并且要求男性与女性的样本各占一半,那么每个子群的容量仅为 200 。这个数字是否符合要求,能使分析人员对两组的特征做出预期的统计推断吗?再如,要按年龄和性别分析调研结果,问题就变得更复杂了。假设要按以下方式将总体样本划分为四组: 35岁以下男性 35岁以上男性 35岁以下女性 35岁以上女性 如果预计每组约占样本的25%,那么子群容量仅有100。随着样本容量的缩小,抽样误差增加,会出现这样一个问题,那就是调研人员很难辨别依据现象所得到的两组间的差别是真正意义上的差别还是由于抽样误差引起的差别。 差异性 差异性的基本概念就是指回答的相似程度。差异性小意味着回答相当相似,差异性大表示回答很不相似。 如果答案曲线图显示十分集中或呈“尖峰”状态,则差异性小。如果曲线图显示受访者在各种可能的答案选项间平均分布,则差异性大。 测量差异性的指标——标准差 标准正态分布 任何正态分布都可以转化为标准正态分布 均值等于0 标准差等于1 如果样本是随机的且容量足够大,则样本均值的分布近似于正态分布 理论基础是中心极限定理:随着样本容量的增加,从任一总体中抽取的大量随机样本平均数的分布接近服从正态分布。 其均值为 ? ,且标准差等于: n为样本容量, ?为总体的标准差 平均数的标准误差:实际总体值与所预期的典型样本结果的差距。 平均数标准误差,即样本均值的标准差(抽样误差)。 由于总体标准差?是未知的,一般由样本标准差s代替。 例如:驾驶里程调查中,样本容量n是100名驾驶者,标准差是3000公里,则平均数标准误差=300。 区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差 而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 样本统计量 (点估计) 置信区间 置信下限 置信上限 第14章 样本容量的确定 ? 14.1 概率抽样中样本容量的 ? 14.2 正态分布 ? 14.3 总体分布、样本分布 ? 14.4 抽样分布 ? 14.5 样本容量的确定 ? 14.6 统计功效 学习目标 1.学习确定样本容量的财务和统计知识 2.确定样本容量的方法 3.熟悉正态分布 4.理解总体、样本及样本分部 5.区分点估计及区间估计 6.识别抽样方式和比例方面存在的问题 1.概率抽样中样本容量的确定 样本容量 含义:样本容量又称“样本数”。指一个样本的必要抽样单位数目。 在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一。因此,在抽样设计时,必须决定样本单位数目,因为适当的样本单位数目是保证样本指标具有充分代表性的基本前提。 1.可支配预算 例如:一个品牌经理如果有40000美元预算可用于某项市场研究,那么除去其他项目成本(如调查方案和问卷的设计数据的处理分析等)后,余下的那部分预算才决定着被调查的样本容量的大小。如果可支配资金太少,可以确定的样本量太小,管理者就必须做出决策是补充更多的资金还是放弃这一项目。 2.经验法则 “一种强烈的感觉”,认为某一特定的样本容量是必要的或合适的。 以“经验性”为幌子,认为样本容量应该是“为保证精度,一般至少应该是总体的5%” 例如关于鞋子的调查:1万名铁人三项运动员;耐克对“飞人乔丹”进行调查,200万名潜在的篮球鞋购买者 简单易行,但不是一种高效率、经济的方法,经验法则方法忽略了抽样的精确度问题。 4.传统的统计方法 总体标准差的估计值 抽样的允许误差范围 抽样结果在实际总体值的特定范围(抽样结果+(-)抽样误差)内的置信水平 正态分布重要的原因 许多变量的概率分布趋于正态分布。爱吃快餐的人平均每月吃快餐的次数,每星期看电视的小时数,男性身高的分布等。 中心极限定理——对于任何总体,不论其分布如何,随着样本容量的增加,抽样平均数的分布趋近于正态分布 2.正态分布 如果多数回答都接近于同一个数字,而且大多数的回答者都集中在某一小范围内,则差异性小;反之,则差异性就大 将两个样本的标准差进行比较,以判定相关的差异性。 比较两个图形,可以得出结论: 在1955年汽车拥有者的驾驶里程较少(平均),而且差异性也不大(标淮差),但现在的
文档评论(0)