第四讲估计与检验.pptVIP

下载本文档

10
0
约5.09千字
约 41页
2017-06-10 发布于北京
举报
版权申诉

第四讲估计与检验.ppt

1、本文档共41页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四讲估计与统计检验沈建荣 jrshen@ynu.edu.cn 一、区间估计总体均值区间估计例1 某小组随机抽样调查了250户家庭的年收入，样本均值为9.8万，样本标准差为4.8万。小组给出一个置信区间（9.2,10.4），但未给出置信水平。 1、问该区间的置信水平？（试比较两种分布的情形） 2、小组给出解释：该地区家庭平均年收入为9.2~10.4的概率为95%，这种说法对吗？ 3、若同时有10个小组在进行相同的独立调查，问9个或以上小组得出的95%置信区间都覆盖总体均值的概率是多少？提示：可以将每一个区间是否覆盖总体均值作为一次Bernoulli试验。令Y为覆盖总体均值的全金属区间数，显然Y~Bin(10,0.95) 单侧置信区间总体均值100(1-α)%的置信区间：例2 1、同例1，问总体均值95%置信区间的下限？当置信水平提高时，估计的可靠性将（提高 or 降低）？精确性将（提高 or 降低）？比例置信区间若X~Bin(n,p)，由中心极限定理例3：某企业从所购买的元件中随机抽检了150份，有5份不合格，估计不合格品率95%置信区间。（试用传统方法和Agresti – Coull 方法分别计算比较）根据指定精度确定所需样本数为获得总体平均100(1-α)%的置信区间，且要求区间宽度不超过D时，则需从这个总体中抽取随机样本数为：例4 例1中，若要求所获得总体均值99%置信区间的偏差为（+-）0.5万元，问至少要调查多少样本？例3中，若要求所获得总体不合格品率99%置信区间的偏差为（+-）0.5%万元，问至少要抽取多少样本？两个总体均值之差的置信区间根据第三讲的知识，请同学们自行给出大样本情形下的计算公式。小样本不能使用中心极限定理，可以使用t分布，计算公式：例5 欲比较A、B两医院住院病人的住院天数。随机抽取A医院64个住院病历，计算平均住院天数为6.54天，标准差为1.2；随机抽取B医院81个住院病历，计算平均住院天数为6.24天，标准差为0.96。则两个医院住院病人平均住院天数差的95%置信区间是多少？有人认为两个医院病人的住院时间没有差异，与上述数据矛盾吗？为什么？例6 随机抽取A、B两地空气污染指数PSI，如下表所示例7 有文献给出一项对睡眠习惯的研究结果。在一个由87个成年人组成的样本中，每天躺在床上的平均时间为7.70小时（不管处于清醒状态还是睡眠状态），标准差为1.02小时，其中处于睡眠状态的平均时间为7.06小时，标准差为1.11小时。所以躺在床上的平均清醒时间为7.70-7.06=0.64小时。有可能建立平均清醒时间95%的置信区间吗？如果行，是多少？如不行，为什么？例8：数据对的置信区间某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在10辆前驱汽车左、右前轮上。4万公里后测量磨损情况如下（单位：mm）：两个总体比例之差的置信区间若X~Bin(nx,px)，Y ~Bin(ny,py)，则 px- py 置信水平为100(1-α)%的置信区间的计算方法为：例9 重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的120个交易账户，有56个订购次数在2次以上。从去年抽取80个样本，有30个订购次数在2次以上。试计算这两年中订购次数在2次以上顾客的比例之差的置信水平为95%的置信区间。二、假设检验问题1 某校新入学学生被随机分配进入高一两个班，人数都是70人，化学课分别由2个老师任教。期末考试的平均分分别是70.5和72.4分，标准差都为5.4分。其中第一个班有一个学生想找第2个班的老师补课，他的选择有道理吗？分析每一次考试都包含很多随机因素；老师1可以认为自己的教学水平（以学生考试平均分来测量）为72.4分；老师1可以认为老师2的教学水平其实和自己是一样的，这次考试的结果是因为自己班级发挥不好而对方班级发挥的好。对于这种具有随机性的结果的证明只能寻求统计意义上的检验。统计检验检验1：老师1的教学水平达不到72.4。零假设（null hypothesis，也称原假设）H0： ?1≥72.4,备择假设（alternate hypothesis） H1： ?1 72.4。检验2：老师1与老师2的教学水平有差异。零假设H0： ?1 - ?2 = 0,备择假设H1： ?1 – ?2 ≠ 0。假设检验的概念假设：对总体参数包括总体均值、比例、方差等的一种看法。假设检验：事先对总体参数或分布形式作出某种假设，然后利用样本信息来判断原假设是否成立。通常依据统计上的小概率不显著原理而对0假设作反证。 0假设：待检验的假设，表示为 H0 备择假设：与0假设对立的假设表示为 H1 假设检验思想