粗糙集理论介绍资料.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
粗糙集理论介绍 问题的提出:知识的含糊性 术语的模糊性,如高矮 数据的不确定性,如噪声 知识自身的不确定性,如规则的前后件间的依赖关系不完全可靠 不完备性,数据缺失 模糊集和基于概率方法,有时需要一些数据的附加信息或先验知识, 如模糊隶属函数,基本概率指派函数和有关统计概率分布等, 而这些信息有时并不容易得到 粗糙集无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的 粗糙集理论的历史 20世纪70 年代, 波兰数学家Z. Pawlak 和一些波兰科学院,波兰华沙大学的逻辑学家们,一起从事关于信息系统逻辑特性的研究. 1982. Z.Pawlak发表论文“Rough Set”.宣告RS的诞生 1991. Z.Pawlak出版著作“Rough Sets: Theoretical Aspects of Reasoning about Data ” 1992. 召开首次国际研讨会,应用专集. 之后得到飞速发展, 在数据挖掘, 模式识别, 粗糙逻辑等方面取得较大进展. 粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分,每一被划分的集合称为概念。 粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画。 Outline: 粗糙集理论的基本概念 粗糙集理论的应用(规则挖掘和属性约简) 其他 基本概念 1 信息系统,决策表 2 知识 3 等价关系,不可分辨关系与基本集 4 下、上近似 正区域,负区域,边界域 5 粗糙度 6 粗糙隶属函数 基本概念(1) 信息系统 基本概念(2):知识 RS中,知识被认为是一种分类能力。人们的行为是基于分辨现实的或抽象的对象的能力。那些根据事务的特征差别将其分门别类的能力都可以看作是某种“知识”。 论域中相互间不可分辨的对象组成的集合。是组成知识的颗粒(granule)。知识是有粒度的. 粒度越小, 能精确表达的概念越多. 粒度的形式表示:不可分辨关系/等价类. 粒度是知识的最小单位。 基本概念(3)不可分辨关系与基本集 不可分辨关系IND(P)/等价关系:分类过程中,相差不大的个体被归于同一类,他们的关系就是不可区分关系。 对于任何一个属性集合P,不可分辨关系用IND表示,定义如下: IND(P)={(x,y) ?U×U:f(x,a)=f(y,a), a?P} 不可分辨关系就是U上的等价关系 基本集:由论域中相互间不可区分的对象组成的集合,是组成论域知识的颗粒。 基本概念(4) 集合的上近似、下近似和边界区 一个对象a是否属于集合X根据现有知识来判断,可分为三种情况: 1)a肯定属于集合X a可能属于也可能不属于集合X a肯定不属于集合X 如果上下近似是相等的, 则这是一个精确集合, 否则它是一个粗糙集, 其中下近似称为该概念的正区域, 上下近似的差称为边界。上近似以外的区域称为负区域(Negative region),记为NEG(x)。 so 基本概念(5)粗糙度 下近似、上近似及边界区等概念称为可分辨区,刻化了一个边界含糊(vague)集合的逼近特性。粗糙程度按右边公式计算。 式中|#|表示集合的基数或势,对有限集合表示集合中所包含的元素个数。 基本概念(6)粗糙隶属函数 (Rough membership function) 含糊集合没有清晰的边界,即,根据论域中现有知识无法判定某些元素是否属于该集合。在RS中,不确定(uncertainty)这个概念是针对元素隶属于集合的程度而言。 粗糙度与粗糙隶属函数 vague(粗糙度):用来描述集合,指集合的边界不清楚 uncertainty(粗糙隶属函数):描述元素,指某个元素是否属于某集合是不确定的。 粗糙集理论的基本概念 粗糙集理论的应用(规则挖掘和属性约简) 其他 粗糙集的应用 粗糙集在数据挖掘中的应用 基于粗糙集的数据约简 1. 粗糙集在数据挖掘中的应用 粗糙集理论的的数学基础:假定所研究的每一个对象都涉及到一些信息(数据、知识),如果对象由相同的信息描述,那么它们就是相似的或不可区分的。 Example 例3 含6个流感病例的表 (表4-3) Step2. 针对各个属性下的初等集合寻找下近似和上近似。 Step3. 获取规则 以“肌肉痛+体温”为例: X={P1,P2,P3,P6} I={{p1},{p2,p5},{p3,p6},{p4}} 2

文档评论(0)

mbxy007 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档