研究生统计课件4——参数估计与假设检验aaa.pptVIP

下载本文档

1
0
约7.05千字
约 62页
2017-08-24 发布于广东
举报
版权申诉

研究生统计课件4——参数估计与假设检验aaa.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

研究生统计课件4——参数估计与假设检验aaa

参数估计与假设检验武汉大学公共卫生学院李十月 lsywhd@ 第一部分参数估计第一节均数的抽样误差与标准误一、均数的抽样误差在医学研究中，绝大多数情况是由样本信息研究总体。由于个体存在差异，因此通过样本推论总体时会存在一定的误差，如样本均数往往不等于总体均数，这种由抽样造成的样本均数与总体均数的差异称为抽样误差。对于抽样研究，抽样误差不可避免。二、抽样误差的分布理论上可以证明：若从正态总体中，反复多次随机抽取样本含量固定为n 的样本，那么这些样本均数也服从正态分布，即的总体均数仍为，样本均数的标准差为。中心极限定理: 当样本含量很大的情况下，无论原始测量变量服从什么分布，的抽样分布均近似正态。三、标准误（Standard Error）样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确，因此可以用标准误表示抽样误差的大小：实际中总体标准差往往未知，故只能求得样本均数标准误的估计值：例4.1 在某地随机抽查成年男子140人，计算得红细胞均数4.77×1012/L，标准差0.38 ×1012/L ，试计算均数的标准误。标准误的用途：标准误是抽样分布的重要特征之一，可用于衡量抽样误差的大小，更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。置信区间与置信水平区间估计的图示评价估计量的标准——无偏性无偏性：估计量抽样分布的数学期望等于被估计的总体参数评价估计量的标准——有效性评价估计量的标准——一致性一致性：随着样本容量的增大，估计量的值越来越接近被估计的总体参数一个总体参数的区间估计模拟实验模拟抽样成年男子红细胞数。设定: 产生100个随机样本，分别计算其95%的可信区间，结果用图示的方法表示。从图可以看出：绝大多数可信区间包含总体参数，只有6个可信区间没有包含总体参数（用星号标记）。例4-2 第三节率的抽样误差与可信区间一、率的抽样误差与标准误标准误的计算二、总体率的可信区间 2. 查表法第二部分假设检验（Hypothesis Testing）反证法思想：事先做出某种假设，如果证据不支持，则否定这一假设。如前例：假设体育生心率与一般学生一致（来自于同一个总体），然后求证现在的差异是由于抽样误差引起的,还是本质的差异。小概率事件：如果两个样本来自于同一总体，则出现的统计量（如均数）差异不会很大，如果出现的差异太大，大到同一总体抽样的两个样本间出现如此大差异的概率小于0.05或0.01，则我们说这一差异不是由于抽样误差引起的，而是本质的差异，所以他们不是来自于同一个总体，因而否定无效假设H0(原始假设），接受备选假设H1，表明两者间的差异有统计学意义。假设检验的思想解释：如果二个或多个样本来自同一个总体，那么样本之间（或样本与总体间）的差异不会很大（是个体差异导致的抽样误差），或者说出现较大差异的可能性(概率)很小(＜0.05)；由这种差异计算出来的统计量 (如T、F、X2)也不会太大，如果太大，则其出现的概率也一定较小，如果概率小到P ＜0.05，则我们人为认定这是一个小概率事件，如果P ＞ 0.05则不是小概率事件。如果这种样本间差异（以及由此计算出来的统计量）出现的概率P ＜0.05，则这种差异被人为认为不是由一个总体中抽出来的样本间能产生的，因而它们之间的差异是本质的差异（称为“差异有统计学意义”）。换句话说，这种差异不是由抽样误差引起的，而是有本质差异，它们不是来自于同一个总体。小概率事件——P≤0.05或P≤0.01 二、两类错误 I型错误（弃真）：拒绝实际正确的H0， I型错误的概率记为α。（1－a）即可信度:重复抽样时，样本区间包含总体参数（m）的百分数。假阳性错误。 II型错误（纳伪） : 不拒绝实际不正确的H0， II型错误的概率记为β。（1－β）即把握度（或检验效能）:两总体确有差别，被检出有差别的能力。假阴性错误。 Ⅰ型错误（typeⅠ error） Ⅰ型错误是指拒绝了实际上成立的H0，即“弃真”的错误。 Ⅰ型错误的概率用α表示。 α的意义是：如果原假设H0成立，对研究总体抽样100次，检验结论