粗糙集理论介绍资料.ppt

下载文档

22
0
约6.51千字
约 41页
2018-04-07 发布于河北
举报
版权申诉
保障服务

粗糙集理论介绍资料.ppt

1、本文档共41页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

粗糙集理论介绍问题的提出：知识的含糊性术语的模糊性，如高矮数据的不确定性，如噪声知识自身的不确定性，如规则的前后件间的依赖关系不完全可靠不完备性，数据缺失模糊集和基于概率方法，有时需要一些数据的附加信息或先验知识, 如模糊隶属函数,基本概率指派函数和有关统计概率分布等, 而这些信息有时并不容易得到粗糙集无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的粗糙集理论的历史 20世纪70 年代, 波兰数学家Z. Pawlak 和一些波兰科学院,波兰华沙大学的逻辑学家们,一起从事关于信息系统逻辑特性的研究. 1982. Z.Pawlak发表论文“Rough Set”.宣告RS的诞生 1991. Z.Pawlak出版著作“Rough Sets: Theoretical Aspects of Reasoning about Data ” 1992. 召开首次国际研讨会,应用专集. 之后得到飞速发展, 在数据挖掘, 模式识别, 粗糙逻辑等方面取得较大进展. 粗糙集理论是建立在分类机制的基础上的，它将分类理解为在特定空间上的等价关系，而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分，每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库，将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画。 Outline：粗糙集理论的基本概念粗糙集理论的应用（规则挖掘和属性约简）其他基本概念 1 信息系统，决策表 2 知识 3 等价关系，不可分辨关系与基本集 4 下、上近似正区域，负区域，边界域 5 粗糙度 6 粗糙隶属函数基本概念（1）信息系统基本概念（2）：知识 RS中，知识被认为是一种分类能力。人们的行为是基于分辨现实的或抽象的对象的能力。那些根据事务的特征差别将其分门别类的能力都可以看作是某种“知识”。论域中相互间不可分辨的对象组成的集合。是组成知识的颗粒（granule）。知识是有粒度的. 粒度越小, 能精确表达的概念越多. 粒度的形式表示:不可分辨关系/等价类. 粒度是知识的最小单位。基本概念（3）不可分辨关系与基本集不可分辨关系IND(P)/等价关系：分类过程中，相差不大的个体被归于同一类，他们的关系就是不可区分关系。对于任何一个属性集合P，不可分辨关系用IND表示，定义如下： IND(P)＝{(x,y) ?U×U:f(x,a)=f(y,a), a?P} 不可分辨关系就是U上的等价关系基本集：由论域中相互间不可区分的对象组成的集合，是组成论域知识的颗粒。基本概念（4）集合的上近似、下近似和边界区一个对象a是否属于集合X根据现有知识来判断，可分为三种情况： 1）a肯定属于集合X a可能属于也可能不属于集合X a肯定不属于集合X 如果上下近似是相等的, 则这是一个精确集合, 否则它是一个粗糙集, 其中下近似称为该概念的正区域, 上下近似的差称为边界。上近似以外的区域称为负区域（Negative region），记为NEG（x）。 so 基本概念（5）粗糙度下近似、上近似及边界区等概念称为可分辨区，刻化了一个边界含糊(vague)集合的逼近特性。粗糙程度按右边公式计算。式中|＃|表示集合的基数或势，对有限集合表示集合中所包含的元素个数。基本概念（6）粗糙隶属函数（Rough membership function) 含糊集合没有清晰的边界，即，根据论域中现有知识无法判定某些元素是否属于该集合。在RS中，不确定（uncertainty）这个概念是针对元素隶属于集合的程度而言。粗糙度与粗糙隶属函数 vague（粗糙度）：用来描述集合，指集合的边界不清楚 uncertainty（粗糙隶属函数）：描述元素，指某个元素是否属于某集合是不确定的。粗糙集理论的基本概念粗糙集理论的应用（规则挖掘和属性约简）其他粗糙集的应用粗糙集在数据挖掘中的应用基于粗糙集的数据约简 1. 粗糙集在数据挖掘中的应用粗糙集理论的的数学基础：假定所研究的每一个对象都涉及到一些信息（数据、知识），如果对象由相同的信息描述，那么它们就是相似的或不可区分的。 Example 例3 含6个流感病例的表（表4－3） Step2. 针对各个属性下的初等集合寻找下近似和上近似。 Step3. 获取规则以“肌肉痛＋体温”为例： X={P1,P2,P3,P6} I={{p1},{p2,p5},{p3,p6},{p4}} 2