- 1、本文档共161页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总体率的区间估计对于事先给定的置信度,若总体率落在某个区间内的概率满足条件:则称区间为总体率的置信度为的置信区间。若每个拥有特征A的个体服从参数为p的两点分布,那么容量为n的样本中拥有特征A的数目X就服从二项分布,由中心极限定理总体率的正态近似估计类似地有:由大数定理,当n足够大时:从而根据中心极限定理有:进而可以给出死亡率的水平为的近似置信区间的估计方程:由前面的中心极限定理,不难得到估计值与真实值之间的抽样误差近似可以表述为:注意到:,由不等式:只要,则抽样误差就满足不等式:。这也是大多数民意调查至少1200个数据的原因。思考题:假设北医三院每日的门诊处方约为4000份,现在要抽查其中出现错误的概率,请问至少应该抽取多少份才是合适的?请针对最近五年的病例给出抽样和研究方案。例题:给10只动物注射某药物,结果有k只动物死亡。当死亡率为0.4时,试求解死亡个数X的95%置信区间。若有4只动物死亡,试求总体的死亡率的95%置信区间。解:假设死亡率给定,则死亡数的置信区间满足条件:等价地,有:从而,查二项分布累积概率表可确定X的上下界的分别为c,d。另一方面,我们可以判定:随着死亡率的不断增大,死亡数X的最可能值则会向右移动。反之,随着死亡率的不断减小,死亡数X的最可能值则会向左移动。这可以用来确定死亡率的置信区间。k从而,查二项分布累积概率表可确定死亡率的上下界。第6章假设检验§6.1基本原理§6.2正态总体假设检验§6.3拟合优度检验§6.1基本原理当总体通过概率分布表征其整体的性质时,统计问题通常表现为参数的估计与检验问题。在一般情形,问题则常表现为对某命题的判定。某位女士宣称自己有能力区分两种奶茶的配制方法,其中一种方法是先泡茶,然后加牛奶(TM);另外的方法是先放奶,然后添加茶水(MT)。请问她的话是否可信?女士品茶为了检验她的说法是否可信,准备了8杯饮料,TM和MT各一半,并且把这点告诉她,随机地让这位女士品尝,指出哪些是TM,哪些是MT,结果是她全部说对了。女士品茶Fisher的推理过程是引进一个假设,H0:这位女士没有鉴别能力如果H0是正确的,她只能随机的从8杯饮料中猜测4杯说是TM,全部猜对的概率为:H0不成立,即她确有鉴别能力;H0成立,意味着一件概率为0.014的随机事件在一次试验中发生了。而她正确地说出了全部的TM,要解释这种现象,只能有两种可能:Fisher认为,随机试验的结果构成一个不利于假设H0的显著性证据,因此应该否定H0。一个概率不到2%的随机事件在一次试验中发生了,这是不太可能的。这种推理过程称为:显著性检验。显著性是统计意义上的显著,意思是一个小概率事件从统计的意义上是否应该发生。统计显著的结果并不意味着在实际中它不可能发生。思考:若这位女士只说对了3杯?一个人纯粹靠随机的猜测,能够说对至少3杯(H0成立)的概率:显然我们不会对一个概率接近25%的随机事件在一次试验中发生而感到惊讶。试验结果并没有提供不利于H0的显著性证据,因此不能否定零假设,而应该接受H0,即应该认为这位女士实际上没有鉴别能力。假设检验的基本定义利用样本提供的信息判断假设是否成立的统计方法,称为假设检验,它是一种统计判决方法。围绕着总体分布的结构,假设检验可分为参数方法和非参数方法。小概率原理小概率原理:一次试验中,概率很小(接近于0)的事件可被认为是实际上不可能发生的极端事件。小概率原理的实质是事件的发生总是合理的,小概率事件不应发生。小概率反证法判断某假设是否成立只能以样本提供的信息来分析,而样本所提供的信息不完整,很难利用它直接验证假设的命题。因此只能借助于小概率原理,从统计的意义上否定不合理的事件。小概率反证法的本质是假设统计总体与概率总体之间的性质是相似的。不合理的事件是不能发生的,而如果相对于原假设是小概率的事件在一次观察中出现,那它就应该来自于不同于原假设的分布,也即原假设不正确。例如:卖鸡蛋者宣称“100个鸡蛋中最多只有1个坏鸡蛋”。现在某消费者买了10个就发现1个坏鸡蛋。命题(假设总体):次品率:样本(样本总体):次品率:分布(概率总体):次品率:利用距离进行量化判定。也即当样本总体和假设总体之间的距离超过一定限度时否决假设命题。但距离必然含有未知参数。利用假设进行合理性判定。也即将备择假设作为参照点。两种解释显著性水平什么样的事件才算是小概率事件?这一般没有统一的标准,通常是由研究者根据具体要求事先确定。我们把这个事先给定的度量事件极端程度的概率称为“显著性水平”。接受域和拒绝域保留原假设的样本观测值所组成的区域称为检验的接受域。使原假设被拒绝的样本观测值所组成的区域称为检验的拒绝域;在假设检验中,总是关心拒绝域。因为拒绝域恰好对应于极端值。综上,统计判决就是利用统计原理将样本分为不同的两个类别。简单的讲
文档评论(0)