离群点检测(基于距离)实验报告.docxVIP

  • 25
  • 0
  • 约8.37千字
  • 约 16页
  • 2016-12-25 发布于重庆
  • 举报
题 目离群点检测(基于距离)学生姓名学生学号专业班级指导教师2015-1-17实验四 离群点检测(基于距离)此实验是在实验三的基础上,修改完成。实验算法与上次相同,但增加了离群点检测。离群点检测方法为:在聚类完成之后,计算簇中的点到各自簇心的距离。当簇中的一点到簇心的距离大于该簇的平均距离与1.5倍标准差的和时,则认为该点为离群点,即阀值平均距离与1.5倍标准差的和。实验目的深刻理解离群点,了解离群点检测的一般方法;掌握基于距离的离群点检测算法;锻炼分析问题、解决问题的思维,提高动手实践的能力。背景知识异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。常见的异常成因:数据来源于不同的类(异常对象来自于一个与大多数数据对象源(类)不同的源(类)的思想),自然变异,以及数据测量或收集误差。异常检测的方法:(1)基于模型的技术:首先建立一个数据模型,异常是那些同模型不能完美拟合的对象;如果模型是簇的集合,则异常是不显著属于任何簇的对象;在使用回归模型时,异常是相对远离预测值的对象;(2)基于邻近度的技术:通常可以在对象之间定义邻近性度量,异常对象是那些远离其他对象的对象;(3)基于密度的技术:仅当一个点的局部密度显著低于它的大部分近邻时才将其分类为离群点。实验要求改写一种简单的半监督方法,用于离群点检测。使用一种你熟悉的程序设计语言,如C++或Java,实现该方法,并在两种不同

文档评论(0)

1亿VIP精品文档

相关文档