统计讲稿3.docVIP

  • 3
  • 0
  • 约1.64万字
  • 约 36页
  • 2017-01-28 发布于重庆
  • 举报
统计讲稿3

第七章 非参数统计 非参数统计Non-parametric Statistics(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 第一节 非参数统计的概念和特点 一、非参数统计Non-parametric Statistics(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 二、主要特点 (1)不要求总体分布已知或对总体分布作任何限制性假定; (2)不以估计总体参数为目的; (3)能用于定性变量(即定名测定和序列测定的变量); (4)方法直观,易于理解,运算比较简单。 (5)缺点是检验的功效不如参数检验方法。 第二节 ???检验 一、什么是 检验 Chi-square test ???检验是运用???分布作为理论工具,在非参数统计中可用于对总体的分布或随机变量的独立性进行的检验。 (一) ??分布 ???分布是由正态分布推导出来的一种连续型随机变量的概率分布。 1.??分布的数学形式 设随机变量x1,x2,…,xk相互独立且都服从正态分布N(μ,σ2)。将它们标准化转变为标准正态变量Z1,Z2,…,Zk,k个独立标准正态变量的平方和被定义为???分布的随机变量??。 ???~ ???(k),k是自由度,表示定义式中独立变量的个数。 当k=1时, 2. ???分布的性质 (1) 分布的值恒为正值,且 (( ??, k) d ??=1; (2)??分布的数学期望是自由度k,方差为2k; (3)??分布取决于自由度k,随着自由度增大而趋于对称。 一般当k≥30时, 分布可用正态分布近似计算。 (二)???检验的原理 在实践中,经常要对一些观察值的实际频数与某种理论频数进行比较,以判断实际结果与理论是否一致。 设有k个观察值,fo为它们的实际频数,fe为理论频数。构造一个统计量 数理统计证明,在大量试验中,若fo与fe相一致时, 服从???分布。 (fo-fe)比较小时, 值也较小;(fo-fe)比较大时,??也较大。当???值大到按???分布超过设定的临界值时,即为小概率事件,就可以认为实际结果与理论假设不一致。 二、拟合优度检验 Goodness of Fit 这是利用随机样本资料对总体是否服从某种理论分布的检验。 检验步骤 对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布 抽样并对样本 以“原假设H0 资料编成频数 为真”导出一组 分布(fo) 期望频数(fe) 确定自由度,并根据 计算检验统计量 给定的α查 表, ???=∑(fo-fe)2/fe 得到临界值 比较???值与临界值 作出检验判断 注意事项 (1)各组理论频数fe不得小于5,如不足5,可合并组; (2)为使组数不致太少,总频数n>50; (3)根据具体情况确定自由度。自由度(df)=k-1-m。其中k为组数(如需合并,则为合并后的组数),m为计算理论频数时所估计参数的个数,减1是因为有一个约束条件∑(f0-fe)=0。 三、独立性检验 是利用样本资料对总体的两个变量的数据是否彼此关联的检验,如果不关联,即为独立。 检验步骤 对总体的两个变量建立假设 H0:两变量独立 H1:两变量关联 将样本资料编成 计算理论频数 r×c列联表,并列 出实际频数Oij 计算检验统计量 确定自由度并根据 给定的α查???表 得到临界值 比较 ??值与临界值 作出检验判断 要点说明 (1)列联表 Contingency table形式(r×c) x y 列(c) 合计 1 2 3 … c 行(r) 1 2 3 . . . r O11 O21 O31 . . . Or1 O12 O22 O32 . . . Or2 O13 O23 O33 . . . Or3 … … … . . . … O1c O2c O3c . . . Orc O1. O2. O3. . . . Or. 合计 O.1 O.2 O.3 … O.c n (2)理论频数Eij的计算 先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(A·B)=P(A)·P(

文档评论(0)

1亿VIP精品文档

相关文档