多维数据异常点识别方法的研究-体育人文社会学专业论文.docxVIP

多维数据异常点识别方法的研究-体育人文社会学专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维数据异常点识别方法的研究-体育人文社会学专业论文

万方数据 万方数据 独创性声明 本人声明,所呈交的学位论文是在导师的指导下独立完成的。论文中 取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰 写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示谢意。 学位论文作者签名: 日 期: 学位论文版权使用授权书 本学位论文作者和指导教师完全了解沈阳体育学院有关保留、使用学 位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印 件和磁盘,允许论文被查阅和借阅。本人同意沈阳体育学院可以将学位论 文的全部或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 半年 □ 一年 □ 一年半 □ 两年 □ 学位论文作者签名: 导师签名: 签字日期: 签字日期: 沈阳体育学院硕士学位论文 摘 要 摘 要 统计数据质量问题一直困扰着我国统计界,是政府和社会各界关心的问题 我们需要 一种能检查和审核统计数据的可靠性和准确性、识别异常数据的定量方法和工具。 在数据处理的过程中偶尔会出现一些异常的,不合逻辑的统计结果,这种结果的出现 很可能是由于所处理的数据中包含异常数据造成的。但目前测量学中所提供的异常数据识 别方法,都只针对一维数据,即只针对单一测量指标进行数据检查。然而,在统计实践中 我们经常会感到仅仅使用单指标进行数据检查不能有效发现测量数据包含的全部异常。 为了探索解决此类问题的方法,提高统计数据的准确性和可靠性,本文通过文献资料 法、比较分析法和探究性实验法,在对常用异常数据识别方法进行分析的基础之上,尝试 寻找一种可应用于多指标情形下的异常数据的识别方法,为数据分析提供便利的辅助工 具。 要建立异常点的识别方法,首先应寻找一个可以表达多指标情形下点与点之间关系 的、简单易用的数量指标。距离是可以满足这个要求的指标之一,利用距离可以表示点与 点间关系。如果某点是样本中的异常点,它必远离样本中的其它点,即与多数点的距离较 大,其平均距离也必大。反之,若某点为正常值,则它必与样本中的某些点相邻较近,距 离较小,则其平均距离必不大。基于此种思想,本文尝试利用点与点之间的平均距离作为 识别多维指标下样本异常值的方法。并分别采用欧氏距离、马氏距离和斜交空间距离进行 尝试。 利用距离建立多指标情形下的异常点识别方法,虽然只是一种尝试,在简单直观的二 维数据的运用效果比较好些,但在多维空间中应用是否有较好的表现,由于缺少直观有效 的判据而无法验证,值得深入研究、继续完善。对于本例,三种距离获得的结果差别不大, 但从距离定义的差别分析,马氏距离应更优于欧氏距离和斜交空间距离。该方法目前尚未 完善,还存在许多问题需要在今后的研究中不断完善。 关键词:异常数据;多维指标;检验方法;距离 Ⅰ 沈阳体育 沈阳体育学院硕士学位论文 Abstract Abstract The quality of statistical data has been disturbing the statistical circle all the time. This is a problem that the government and all circles in the society are all concerned about. We need a quantitative method and means that can inspect and audit the reliability and accuracy of the data, it also can distinguishing the abnormal data. It occasionally appears some abnormal and illogical statistical results during the process of data. The appearance of the results is caused by abnormal data that included in processed data. But the identification methods of abnormal data that is provided in present surveying, they all aim to One-dimensional data. That is to say, they only aim to single measuring norm to check the data’s inspection How ever, we always feel that

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档