Statistics (SUFE)幻灯片.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点 不要求总体分布已知或对总体分布作任何限制性假定; 不以估计总体参数为目的; 能适用于定性变量中的定类数据或定序数据 ,也能适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。 缺点是检验的功效不如参数检验方法。 主要内容 χ2检验 成对比较检验 曼—惠特尼U检验 游程检验 等级相关检验 χ2检验 一、什么是χ2检验 χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。 设有k(K>2)个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计量 其中,k-1为自由度。 皮尔生定理表明,当样本容量充分大时,样本分成K类,则χ2统计量服从χ2分布。自由度为k-1 1、拟合优度检验 二、应用 利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。 检验步骤 抽样并对样本资料编成频数分布,形成k个互斥的类型组。 (f0) 对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布 以“原假设H0为真”导出一组期望频数(fe) 计算检验统计量 比较χ2值与临界值 作出检验判断 自由度(df)=k-1-m。 其中k为组数。(各组理论频数不得小于5,如不足5,可合并相邻的组,如需合并,则k为合并后的组数) m为计算理论频数时所估计参数的个数。(未指定总体的参数,需要观察值计算相应的统计量,作为未参数的估计值) 。 x y 2·一元线性回归模型的确定 根据实际数据,用最小平方法,即使 ,分别对a、b求编导并令其为零,求得两个标准方程: 解联立方程,得到 3·一元线性回归模型拟合优度的评价 判定系数(r2) 是对回归模型拟合优度的评价。 x y 总偏差 = 回归偏差 + 剩余偏差 r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。 r 的符号同 b 估计标准误(Sxy) Sxy 越小, 拟合越好; Sxy 越大, 拟合越差。 Sxy也是用自变量对因变量进行区间估计的抽样误差。 68.27% 94,45% 99.73% 是一个测量Y的实际值与Y的预测值之间离散程度的统计量。 4·回归分析中的假设条件和残差分析 回归分析中的假设条件 随机误差项ε的理论假定 值相互独立 服从正态分布 的数学期望E( )=0 的方差 都相同,且 残差分析 随机误差项ei = Yi -又称为残差,对残差进行分析,既能用来评价回归模型与实际数据的拟合优度,也能评价回归的假设能否成立。 评价回归模型的拟合优度 可通过绘制残差图直观地进行评价。 残差图是以残差为纵坐标、以相应自变量的X值为横坐标的散点图。 散点的分布不存在明显的变化规律 ,说明建立的模型对数据是合适的 。 散点的分布有明显的变化规律 ,说明建立的模型对数据是不合适的 。 假设条件的评估 (1)等方差性 :通过残差与Xi的残差图来评价 残差 0 X 0 此图中,散点如扇形般地展开,即显示出X增大时残差的变异也在增大,证明了在X的每个水平上,Y缺少等方差性 (2)正态性。可通过残差分析中计算残差的频数分布,并把其结果用直方图加以反映和评估。 引例店址选择的数据,可把残差列成如表的频数分布,并把其结果可用直方图展示出来 . 残差 频数 -300到-200 1 -200到-100 2 -100到0 4 0到100 4 100到200 4 合计 15 (3)独立性。可根据数据获得的先后顺序排列的残差散点图来评估。 在一段时间内收集的数据,有时观测值中会存在着自相关的影响。此时,前后之间的残差就会有某种联系。若存在这种联系,就违背了独立性假设,这将很明显地在残差对收集数据的时间散点图上反映出来。自相关的影响可用杜宾—沃特森统计量进行测度 5·一元线性回归模型的显著性检验 回归系数b的检验: 设总体回归系数为β H0:β=0;H1:β≠0 n≥30时 检验统计量 (β=0) σb是样本回归系数抽样分布的标准差。通常是未知的,用其估计量 代替。 给定显著性水平α,查Z表可知其临界值 。 n<30时 (β=0) 给定显著性水平α,查t表可知其临界值 。 0 0 Z t 回归模型整体的F检验 H0:R2=0;H1:R20 检验统计量 F 6·应用回归方程进行估计 n≥30时 给定x0,y0的置信度(1-α)的置信区

文档评论(0)

mwk365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档