网站大量收购独家精品文档,联系QQ:2885784924

统计数据中异常值检验方法.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
舢年第5期 统计研究 No.S20∞ Statlstl枷Rqmmreh 53 统计数据中异常值的检验方法 张德然 C占 庐 A蛐ACT Instatistics.the the ofdataistheerror.whichisthe re8son keyproblemaffectingquality major to Outthem.Asa methodwhichearl oudiem.Therefore.it’scritical result,8 causing pick pract/ealtesting he tokindsofcasesis theresultsofconcrete andlimitationshowits applied developed.and examples convenience and}ligIlcfeclibility. 关键词:统计数据;异常值;检验 机对数据问的逻辑关系进行检查和纠正,然而面对混杂 一、异常值的两种理解 在大量原始数据中的异常数据却难以较准确地判断。尤 统计数据质量问题一直困扰着我国统计界,也为社 其是广义定义上的异常值,到目前为止国内外尚无有效 会各界所关注。所以近年来对其理论上的研究探讨始络 的方法将其一一检验出来。对于狭义定义下的异常值, 保持热点。但研究的重点主要是在健全坑计法律制度和 由于它们对统计分析的结果反应灵敏及数学上的处理相 完善工作程序等方面。毫无疑问,这些确实是提高统计 对来说较简单。近年来,国内外不少学者从不同角度对 数据质量的重要方面。但统计数据质量问题本质上是误 其给出了一些方法。特别是在电子产品的可靠性研究、 差同题。即所提供的统计数据与客观的社会经济现象实 机械制造业的可靠性疲劳试验、橡睦工业的试验以及其 际的数量特征之间的差距同题。如果数据中混进了异常 它行业对产品质量等的统计分析中,其相关的敦据均可 值.就会使相应统计分析误差增大,小则出差错,大则发 视之为“寿命数据”。对本数据的描述,指数分布,伽玛分 生事故,甚至导致宏观决策上的失误。因此.在利用统计 布.威布尔分布以及对数正态分布占据了十分重要的角 数据进行统计分析之前,有必要对其进行异常数据的检 色,因为它们在相当广泛的范围内具有实用性。正是基 验。 于此,国内外已有的文献基本上都是针对上述分布研究 何谓异常数据?从有关文献中我们可以发现国内外 了异常数据的检验问题。同时国家标准局也已颁布了正 的一些学者们认识不尽相同,归纳起来笔者把其界定为 态分布、极值分布以及指教分布异常数据的判断和处理 两种,从它们的内涵关系,称其分别为广义及狭义定义。 的三个国家标准,供实际工作者使用。 定义l(广义定义):在所获坑计数据中相对误差较大 二、异常值检验的方法 的观察数据称之为异常值(outlier)。或称奇异值。 定义2(狭义定义)

您可能关注的文档

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档