面向含噪数据流的概念漂移集成分类的研究.pdf

面向含噪数据流的概念漂移集成分类的研究.pdf

面向含噪数据流的概念漂移集成分类研究 摘 要 随着网络通信、计算机科学与信息技术的发展,数据流作为一种新的数据 形式在金融数据分析、网络监控、电信数据处理与传感器网络等领域有着广泛 的应用。相对于静态数据,数据流不仅具有连续性、快速性和无限性的特点, 而且随着时间的推移其中蕴含的概念会发生变化,即概念漂移,这给传统算法 和应用系统都带来了巨大的挑战。虽然目前数据流上的研究已取得一定的成果, 但是在概念漂移的处理和噪音数据问题上仍存在着明显的不足。本文主要针对 数据流上的分类问题做了以下工作: (1) 概述了数据流的基本概念及研究背景,分析了数据流处理的常用方法 和模型特点,并详细描述了噪音数据流上的概念漂移问题与研究进展。 (2) 针对已有方法在处理数据流概念漂移时受噪音干扰正确率较低的问 题,提出了基于混合集成框架的数据流分类算法 CDSMM 。该算法采用假设检 验中的 μ检验方法检测概念漂移,基于 Na ïve Bayes 分类器过滤噪音,在检测 到概念漂移时及时更新模型以适应变化。实验表明,与 weighted-bagging 等基 于单一分类器的集成方法相比,该算法的分类精度具有显著优势,且具有较

文档评论(0)

1亿VIP精品文档

相关文档