- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
表5-3 700只手表时间误差的频数分布 24小时内走快或走慢的秒数 表的数目Oi 0-9.99 38 10-19.99 51 20-29.99 62 30-39.99 74 40-49.99 83 50-59.99 91 60-69.99 81 70-79.99 72 80-89.99 61 90-99.99 52 100-109.99 35 合计 700 一、正态分布拟合 1.预期频数Ei的计算 根据概率分布原理,我们可以通过求正态分布曲线下的面积来确定理论预期频数。为了计算正态分布曲线下的面积,利用公式Zo=(Xo-u)/δ将Xo标准化,求标准正态表上相应的面积(即频率)。 因为零假设中并没指定总体分布的均值(u)和标准差(δ)。所以只有将样本均值 =54.71和标准差S=27.61分别作为u和δ的估计值。 如在区间[10-19.99]内的预期频数,可按如下步骤计算: 1.预期频数Ei的计算 (1)分别对x=10和x=20标准化:Z=(10-54.71)/27.61=-1.62和Z=(20-54.71)/27.61=-1.26。其余类推。 (2)查标准正态分布表,介于0和-1.62之间的面积(概率)为0.4474,介于0和-1.26之间的面积为0.3962,所以介于-1.62和-1.26之间的面积等于0.4474-0.3962=0.0512。其余类推。 (3)于是落在10与20之间的预期频数为0.0512×700=35.84。其余类推。 一、正态分布拟合 2.约束条件r的确定 ⑴预期频数之和必等于700,即等于样本容量,这就构成一个约束; ⑵又由于我们必须通过样本来估计u和δ,所以对数据还须增加两个约束。于是γ=3,自由度k-γ=11-3=8。 注意:如果u和δ在零假设中已被指定,那就不必再用样本数据来估计,这时γ=1。 检验统计量X2= (Oi-Еi)2/Еi=20.3558,X2的临界值为15.507。由于X2的计算值大于临界值,所以否定零假设,样本数据并非来自正态分布。 一、正态分布拟合 小预期频数 在应用卡方检验时,有可能遇到预期频数很小的情形,这时将随机分布取作卡方的近似分布并不完全正确。 对于什么样的预期频数才算小预期频数,学者们的意见并不一致。较保守的学者一般要求预期频数至少应大于等于5。而科库兰Cochran(1952,1954)主张预期频数小于1的就算小预期频数,很多学者同意这种意见。本教材也采用了这一观点。 对小预期频数的处理一般采用的科克兰的法则。如将相邻类目的频数合并(前提是不破坏其分类意义),以达到所要求的最小频数。合并后的类数应相应地减小。 二、二项分布拟合 例8.8: 一个市场分析员想研究食品店的顾客对待信用卡付款方式的态度。研究员从100家超级市场各抽选了25名经常性顾客作为随机样本,并对其中每一个进行访问以确定此人是否喜欢除信用卡付款方式以外的别的某种付款方式。调查结果列于表8-5: 解:这个分析员应先提出如下假设: H0:在这些容量为25的样本中,喜欢另外某种付款方式的顾客数服从二项分布; H1:不服从二项分布。(取a=0.05) 表5-5 例5.5中的抽样结果 喜欢另外某一种付款方式的顾客数 商店数 0 4 1 5 2 8 3 10 4 14 5 15 6 12 7 16 8 10 9 6 10或更多 0 合计 100 二、二项分布拟合 首先求得P的估计值如下:P={4(0)+5(1)+8(2)…+6(9)}/2500=0.20。 由于二项分布的参数P没有指定,必须通过样本数据对它作出估计,因此要损失一个自由度。 1.预期频数Еi 通过计算函数f(x)=C25x(0.2)x(0.8)25-x(其中x为某一特定商店中喜欢另外某种付款方式的顾客数,x=0,1,2,…,25)或查的二项分布表,可以得到所需的相对预期频数。 二、二项分布拟合 2.自由度的确定 合并后的类目数10,但由于预期频数之和必须与观察频数之和一致,这个自由度应减去1,又由于P必须通过样本数据来估计,自由度再减1。于是真正的自由度应为10-2=8。 检验统计量=28.1 显著性水平a=0.05和自由度8相对应的X2的临界值为15.507。因为X2的计算值大于的临界值,所以否定零假设,从而得出这些数据并非来自二项分布总体的结论(P<0.05)。 二、二项分布拟合 三、泊松分布拟合 例8.9: 旅馆管理人员对90天内房间预定和注销的格局进行了研究,其观察结果如表5-7。他想了解“每日注销的房间数是否服从泊松分布”?(取a=0.05) 解:由于泊松分布的参数λ并未给出,我们只有利用表中数据对它进行估计: λ =[0(9)+1(17)+…+8(2)]/90=2.6 泊松分布的函
文档评论(0)