类非均衡数据集过采样技术研究.pdf

类非均衡数据集过采样技术研究

摘要

在大数据时代,类非均衡数据集分类问题已成为数据挖掘和机器学习领域的重要研

究方向之一。传统分类算法对非均衡数据集分类时,由于数量上的巨大差异,分类规则

往往倾向于多数类样本,导致少数类样本容易被误分类为多数类样本。在非均衡数据集

中,少数类样本往往具有更重要的价值信息,在一些场景(如网络入侵、癌症疾病的诊

断等)下,错误的分类会造成严重的后果,传统分类算法在处理类非均衡数据的效果难

以满足实际应用需求。目

文档评论(0)

1亿VIP精品文档

相关文档