chap1-数据挖掘介绍概述.pptVIP

  • 5
  • 0
  • 约1.41万字
  • 约 82页
  • 2016-11-12 发布于湖北
  • 举报
聚类:应用2 离群点分析 离群点分析 离群点:一些与数据的一般行为或模型不一致的孤立数据 通常孤立点被作为“噪音”或异常被丢弃,但在欺骗检测中却可以通过对罕见事件进行孤立点分析而得到结论。 离群点识别 使用统计试验检测。假定一个数据分布或概率分布,使用距离进行度量,到其他各个簇距离很大的对象被视为离群点; 基于偏差的方法。考察一群对象主要特征上的差别来识别。 应用 信用卡欺诈检测 移动电话欺诈检测 客户划分 医疗分析(异常) 演变分析 描述行为随时间变化的对象的发展规律或趋势,并对其建模。 将特征化、区分、关联、分类、聚类等技术应用于时间相关数据 一些演变分析的热点 时间序列数据分析:即预测,通过对大量时间序列数据的分析找到特定的规则和感兴趣的特性,目的对未来的情况作出估计。 序列或周期模式:用某时间点发现的产品购买或其他行为模式来预测将来购买产品或者服务类别的概率。 基于相似性的数据分析 目录 为什么要进行数据挖掘 1 什么是数据挖掘 2 对何种数据进行数据挖掘 3 数据挖掘的主要功能 4 * * 使用什么技术进行数据挖掘 5 数据挖掘与其他科学的关系 数据挖掘作为一门新兴的交叉学科,涉及数据库系统、数据仓库、统计学、机器学习、可视化、信息检索和高性能计算等诸多领域。 此外,还与神经网络、模式识别、空间数据分析、图像处理、信号处理、概率论、图论和归纳逻

文档评论(0)

1亿VIP精品文档

相关文档