- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四讲 估计与统计检验 沈建荣 jrshen@ynu.edu.cn 一、区间估计 总体均值区间估计 例1 某小组随机抽样调查了250户家庭的年收入,样本均值为9.8万,样本标准差为4.8万。小组给出一个置信区间(9.2,10.4),但未给出置信水平。 1、问该区间的置信水平?(试比较两种分布的情形) 2、小组给出解释:该地区家庭平均年收入为9.2~10.4的概率为95%,这种说法对吗? 3、若同时有10个小组在进行相同的独立调查,问9个或以上小组得出的95%置信区间都覆盖总体均值的概率是多少?提示:可以将每一个区间是否覆盖总体均值作为一次Bernoulli试验。令Y为覆盖总体均值的全金属区间数,显然Y~Bin(10,0.95) 单侧置信区间 总体均值100(1-α)%的置信区间: 例2 1、同例1,问总体均值95%置信区间的下限? 当置信水平提高时,估计的可靠性将(提高 or 降低)?精确性将(提高 or 降低)? 比例置信区间 若X~Bin(n,p),由中心极限定理 例3: 某企业从所购买的元件中随机抽检了150份,有5份不合格,估计不合格品率95%置信区间。(试用传统方法和Agresti – Coull 方法分别计算比较) 根据指定精度确定所需样本数 为获得总体平均100(1-α)%的置信区间,且要求区间宽度不超过D时,则需从这个总体中抽取随机样本数为: 例4 例1中,若要求所获得总体均值99%置信区间的偏差为(+-)0.5万元,问至少要调查多少样本? 例3中,若要求所获得总体不合格品率99%置信区间的偏差为(+-)0.5%万元,问至少要抽取多少样本? 两个总体均值之差的置信区间 根据第三讲的知识,请同学们自行给出大样本情形下的计算公式。 小样本不能使用中心极限定理,可以使用t分布,计算公式: 例5 欲比较A、B两医院住院病人的住院天数。随机抽取A医院64个住院病历,计算平均住院天数为6.54天,标准差为1.2;随机抽取B医院81个住院病历,计算平均住院天数为6.24天,标准差为0.96。则两个医院住院病人平均住院天数差的95%置信区间是多少?有人认为两个医院病人的住院时间没有差异,与上述数据矛盾吗?为什么? 例6 随机抽取A、B两地空气污染指数PSI,如下表所示 例7 有文献给出一项对睡眠习惯的研究结果。在一个由87个成年人组成的样本中,每天躺在床上的平均时间为7.70小时(不管处于清醒状态还是睡眠状态),标准差为1.02小时,其中处于睡眠状态的平均时间为7.06小时,标准差为1.11小时。所以躺在床上的平均清醒时间为7.70-7.06=0.64小时。有可能建立平均清醒时间95%的置信区间吗?如果行,是多少?如不行,为什么? 例8:数据对的置信区间 某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在10辆前驱汽车左、右前轮上。4万公里后测量磨损情况如下(单位:mm) : 两个总体比例之差的置信区间 若X~Bin(nx,px),Y ~Bin(ny,py),则 px- py 置信水平为100(1-α)%的置信区间的计算方法为: 例9 重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的120个交易账户,有56个订购次数在2次以上。从去年抽取80个样本,有30个订购次数在2次以上。试计算这两年中订购次数在2次以上顾客的比例之差的置信水平为95%的置信区间。 二、假设检验 问题1 某校新入学学生被随机分配进入高一两个班,人数都是70人,化学课分别由2个老师任教。期末考试的平均分分别是70.5和72.4分,标准差都为5.4分。其中第一个班有一个学生想找第2个班的老师补课,他的选择有道理吗? 分析 每一次考试都包含很多随机因素; 老师1可以认为自己的教学水平(以学生考试平均分来测量)为72.4分; 老师1可以认为老师2的教学水平其实和自己是一样的,这次考试的结果是因为自己班级发挥不好而对方班级发挥的好。 对于这种具有随机性的结果的证明只能寻求统计意义上的检验。 统计检验 检验1:老师1的教学水平达不到72.4。 零假设(null hypothesis,也称原假设)H0: ?1≥72.4,备择假设(alternate hypothesis) H1: ?1 72.4。 检验2:老师1与老师2的教学水平有差异。 零假设H0: ?1 - ?2 = 0,备择假设H1: ?1 – ?2 ≠ 0。 假设检验的概念 假设:对总体参数包括总体均值、比例、方差等的一种看法。 假设检验:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。通常依据统计上的小概率不显著原理而对0假设作反证。 0假设:待检验的假设,表示为 H0 备择假设:与0假设对立的假设表示为 H1 假设检验思想
文档评论(0)