统计学第七章假设检验及非参数统计.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第七章假设检验及非参数统计

第七章 假设检验 一、提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis) 所谓原假设,是指需要进行验证的统计结论。 原假设是作为统计分析前提的假设,备择假设是在原假设不成立的情况下所接受的假设。 原假设与备择假设有时是互补的,有时不互补。 例如,原假设:北京市居民的平均收入是1200元;备择假设:北京市居民的平均收入大于1200元。这时的备择假设不是原假设的互补情况。 二、确定适当的检验统计量T 检验统计量T是用于检验原假设是否成立的标准,在原假设成立的前提下,统计量T满足某种特征。 四、计算检验统计量T的值 根据检验中获得的数据,计算统计量T的值。 五、作出统计决策 根据T的取值特征,计算取该值的概率,如果此概率小于a,则拒绝原假设。 第一节 检验原理 一、提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis) 二、确定适当的检验统计量T 三、规定显著性水平α(犯弃真错误的概率) 四、计算检验统计量T的值 五、作出统计决策 案例: 某裁判观察到球员A有类似于上肢触球的表现,现需决定是否判其为手球。 1、确定原假设:球员A没有上肢触球 2、确定统计量T:球在接触球员A的身体后反弹的角度 3、确定显著性水平:α=0.05 4、计算T值:根据裁判的观察确定球的反弹角度为X 5、统计判断:当一名球员使用上肢之外的身体部分触球时,球的反弹角度为X的概率为0.03。由于0.03<0.05,拒绝原假设,即认为球员A存在上肢触球。 在本例中,有3%的可能性发生弃真错误,即球员A没有上肢触球,但裁判作出了错误判断。 显著性水平α在这里决定了某一个结论能否被接受。 本例,如果α变为0.15,这时当一名球员使用上肢之外的身体部分触球时,球的反弹角度为X的概率为0.10,就可以拒绝原假设,即认为球员A存在上肢触球。但如果α为0.05,在反弹角度为X的概率为0.10时,就要接受原假设。 可见α为0.15时更严格,即拒绝原假设的概率增加了。 α取0.05和0.15,对于裁判员来说都有道理,裁判员可以通过调整α的大小来调节球场气氛。 第二节 利用正态分布的假设检验案例 利用正态分布的特征进行假设检验是比较常用的方法,有许多统计量符合正态分布,因此可以利用正态分布进行分析。 案例: 某厂产品使用寿命符合正态分布,其中μ0=1020,S=100,从最近生产的产品中抽选16件,测得μ1=1080,试在α=0.05的水平下,检验产品质量是否有显著提高。 本题解法: 本例使用正态分布的前提条件, H0:μ1=μ0=1020; H1:μ1>μ0=1020 如果只想考察μ1是否与μ0相等,这时的t=1.96,但z=2.4>1.96,仍然拒绝原假设。 统计软件中提供的P-level为统计量处于T值范围之外的概率,当此概率小于α值时,拒绝原假设。 在本例中,P(Z2.4)=0.00820.05 因此拒绝原假设。 在统计软件中,对于左侧、右侧和双侧检验需进行区分。 第三节 非参数检验 非参数统计方法不涉及描述总体分布的有关参数,例如正态分布的方差、期望等内容,因此称为与分布无关的(Distribution Free)。 在推断过程中,仍需利用样本的其他分布信息,尤其是关于秩(rank)的信息。 将数据从小到大进行排列,每一个具体数据项所处的位置或次序,称为该数据的秩。 一、卡方检验(Chi-Square Goodness-of-Fit Test) 卡方检验一直有极其广大的应用领域,所有这些应用有一个共同点,即拥有足够大的样本使得在零假设下通过多元的正态中心极限定理来保证检验统计量有渐近的Chi-Square分布。 例题: 已知某型生态群落中A、B、C、D四类植物的比重分别为80%,12%,7%和1%。现观察某地共500株植物,发现四类植物的数量分别为380、69、43和8株。 试在5%的显著性水平下,判断该地生态群落是否为某型。 构造一个统计量: 二、列联表分析 列联表是调查数据处理中最常见的形式。列联表分析的目的在于研究两个变量之间是否存在相互影响的关系。可以认为是一种定类尺度的相关分析。 例题: 下例为三种不同类型电风扇在三个不同地带销售的数量情况。欲了解电风扇类型与地带之间是否存在相关关系。 假定销售地区与销售产品类型之间没有相关关系,则同为台式电风扇,在热带、温带、寒带的销售数量比例应当等同于这三个地带购买电风扇数量的比例。 即:台式-热带=48×111/337 同样可求出其余各单元格的期望数值。 三、符号检验 对于一个只存在+、-两种符号的序列,考察两种符号的出现是否具有倾向性。 建立原假设H0:P+=P- 计算两种符号的数量S+和S-,利用二项分布计算S+或S-

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档