数据挖掘与知识发现(讲稿6---粗糙集挖掘技术).docVIP

  • 3
  • 0
  • 约6.26千字
  • 约 17页
  • 2017-08-31 发布于安徽
  • 举报

数据挖掘与知识发现(讲稿6---粗糙集挖掘技术).doc

第6章 基于粗糙集(Rough Set)理论的数据挖掘技术 粗糙集理论是由波兰华沙理工大学数学家Z.Pawlak于1982年提出的一种数据分析理论,该理论在分类意义下定义了模糊性和不确定性两个概念。是一种处理不完整数据、不精确知识的表达、学习、归纳等的一种新型数学工具。 粗集理论的重要特点是:不需要任何附加信息或先验知识,直接从所需处理的数据本身所提供的信息出发找出问题的内在规律。 目前,大多数数据挖掘工具软件(如:AQ系统、IDS系统等)都是基于集合论开发的,其中粗糙集(RS)理论使用最广,也最有发展前途。 由于RS是研究不精确和不确定知识的一种数据工具,如,知识的含糊性,主要包括:①术语的模糊性,如高矮;②数据的不确定性,如噪声;③知识自身的不确定性,如规则的前后件间的依赖关系不完全可靠等。所以,它同其它不确定问题理论,如,概率统计理论中的概率分布、模糊理论不能处理不完整数据且需提供隶属函数这种先验知识、D-S证据理论中的基本概率赋值等相比,更具实用性。 粗集理论的主要思想:是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。 目前,RS理论已成功地应用于机器学习、过程控制、模式识别、数据挖掘、预测、故障诊断、决策分析和人工神经网络等领域,成为其它不确定理论的一种补充,有着不可替代的优越性。 1. 粗糙集理论的基本概念 (1) 知识和知识库 设为论域,任何子

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档