数据挖掘与知识发现(讲稿6---粗糙集挖掘技术).docVIP

下载本文档

3
0
约6.26千字
约 17页
2017-08-31 发布于安徽
举报

数据挖掘与知识发现(讲稿6---粗糙集挖掘技术).doc

第6章基于粗糙集（Rough Set）理论的数据挖掘技术粗糙集理论是由波兰华沙理工大学数学家Z.Pawlak于1982年提出的一种数据分析理论，该理论在分类意义下定义了模糊性和不确定性两个概念。是一种处理不完整数据、不精确知识的表达、学习、归纳等的一种新型数学工具。粗集理论的重要特点是：不需要任何附加信息或先验知识，直接从所需处理的数据本身所提供的信息出发找出问题的内在规律。目前，大多数数据挖掘工具软件（如：AQ系统、IDS系统等）都是基于集合论开发的，其中粗糙集（RS）理论使用最广，也最有发展前途。由于RS是研究不精确和不确定知识的一种数据工具，如，知识的含糊性，主要包括：①术语的模糊性，如高矮；②数据的不确定性，如噪声；③知识自身的不确定性，如规则的前后件间的依赖关系不完全可靠等。所以，它同其它不确定问题理论，如，概率统计理论中的概率分布、模糊理论不能处理不完整数据且需提供隶属函数这种先验知识、D-S证据理论中的基本概率赋值等相比，更具实用性。粗集理论的主要思想：是在保持分类能力不变的前提下，通过知识约简，导出问题的决策或分类规则。目前，RS理论已成功地应用于机器学习、过程控制、模式识别、数据挖掘、预测、故障诊断、决策分析和人工神经网络等领域，成为其它不确定理论的一种补充，有着不可替代的优越性。 1. 粗糙集理论的基本概念（1）知识和知识库设为论域，任何子

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据挖掘与知识发现(讲稿6---粗糙集挖掘技术).docVIP