- 1、本文档共76页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]4粗糙集与数据约简
智能信息处理技术 华北电力大学 第4章 粗糙集与数据约简 4.1、不确定性理论 自然界和人类的社会活动的各种现象:确定性现象和不确定性现象。 确定性现象:在一定条件下必然会出现的现象。 不确定性的分类: 随机性:因为事物的因果关系不确定,从而导致事件发生的结果不确定性。用概率来度量。概率表示事件发生可能性的大小。概率论的运用是从随机性中去把握广义的因果律——概率规律。 模糊性:因为事件在质上没有明确的含义,在量上没有明确的界限,导致事件呈现“亦此亦彼”的性态,是事物类属的不确定性,用隶属度来度量。隶属度表示事物多大程度属于某个分类。模糊集合论的运用从模糊性中去确立广义的排中律——隶属规律。 粗糙性:因为描述事件的知识(或信息)不充分、不完全,导致事件间的不可分辨性。粗糙集把那些不可分辨的事件都归属一个边界域。因此,粗糙集中的不确定性是基于一种边界的概念,当边界域为一空集时,则问题变为确定性的。 4.1、不确定性理论 经典集合、模糊集合、粗糙集的关系 经典集合认为一个集合完全有其元素所决定,一个元素要么属于这个集合,要么不属于这个集合。其隶属函数μX(x)?{0,1}是二值逻辑。 模糊集合认为事物具有中介过渡性质,而非突然改变,集合中每一个元素的隶属函数μX(x)?[0,1],即在闭区间[0,1]可以任意取值,隶属函数可以是连续光滑的,因此模糊集合对不确定信息的刻划是精细而充分的。但隶属函数不可计算,凭人的主观经验给定。 粗糙集合把用于分类的知识引入集合。一个元素x是否属于集合X,需要根据现有知识来判定,可分为三个情况:①x肯定不属于X;②x肯定属于X;③x可能属于也可能不属于X。到达属于哪种情况依赖于我们所掌握的关于论域的知识。粗糙集的隶属函数为阶梯 状,对不确定性信息的描述是粗糙的, 但粗糙隶属函数是可计算的。粗糙集主 要用于对信息系统进行约简和分类。 第4章 粗糙集与数据约简 4.2 粗糙集的基本理论与方法 4.2.1、粗糙集的基本概念 知识与分类 在粗糙集理论中,知识被认为是一种分类能力。人们的行为基本是分辨现实的或抽象的对象的能力。 假定我们起初对论域内的对象(或称元素、样本、个体)已具有必要的信息或知识,通过这些知识能够将其划分到不同的类别。若我们对两个对象具有相同的信息,则它们是不可区分的,即根据已有的信息不能将其划分开。 粗糙集理论的核心是等价关系,通常用等价关系替代分类,根据这个等价关系划分样本集合为等价类。 从知识库的观点看,每个等价类被称为一个概念,即一条知识(规则)。即,每个等价类唯一地表示了一个概念,属于一个等价类的不同对象对该概念是不可区分的。 4.2.1、粗糙集的基本概念 知识表达系统 一个知识表达系统或信息系统S可以表示为有序四元组 S={U,R,V,f} 其中,U={x1,x2,…,xn}为论域,它是全体样本的集合; R=C∪D 为属性集合,其中子集C是条件属性集,反映对象的特征,D为决策属性集,反映对象的类别; 为属性值的集合,Vr表示属性r的取值范围; f:U×R→V 为一个信息函数,用于确定U中每一个对象x的属性值,即任一xi?U,r?R,则f(xi,r)=Vr 4.2.1、粗糙集的基本概念 不可分辨关系 在粗糙集中,论域U中的对象可用多种信息(知识)来描述。当两个不同的对象由相同的属性来描述时,这两个对象在该系统中被归于同一类,它们的关系称之为不可分辨关系。即对于任一属性子集B?R,如果对象xi,xj?U,?r?B,当且仅当f(xi,r)=f(xj,r)时,xi和xj是不可分辨的,简记为Ind(B)。不可分辨关系称为等价关系。 例如:只用黑白两种颜色把空间中的一些物体划分成两类:{黑色物体}、{白色物体},那么同为黑色的物体就是不可分辨的,因为描述它们特征属性的信息是相同的,都是黑色。如果引入方、圆的属性,可将物体进一步划分为4类:{黑色方物体}、{黑色圆物体}、{白色方物体}、{白色圆物体}。这时,如果有两个同为黑色方物体,则它们还是不可分辨的。 不可分辨关系这一概念在RS中十分重要,它反映了我们对世界观察的不精确性。 另一方面,不可分辨关系反映了论域知识的颗粒性。知识库中的知识越多,知识的颗粒度就越小,随着新知识不断加入到知识库中,粒度会不断减小,直致将每个对象区分开来。但知识库中的知识粒度越小,则导致信息量增大,存储知识库的费用越高。 4.2.1、粗糙集的基本概念 基本集合 由论域中相互不可分辨的对象组成的集合称之为基本集合,它是组成论域知识的颗粒。 例如:考虑条件属性:头疼和 肌肉疼。对于x1,x2,x3这三个 对象是不可分辨的。x4,x6在这 两个属性上也是不可分辨的。 由此构成的不可分辨集{x1,x2, x3},{x4,x6},{x5}被
您可能关注的文档
- [工学]2电阻式传感器.ppt
- [工学]2珠光体转变.ppt
- [工学]2随机过程的基本概念1.ppt
- [工学]2章 热力学第二定律.ppt
- [工学]2集成运算放大器.ppt
- [工学]2钢的强化和韧化.ppt
- [工学]3 平面的投影.ppt
- [工学]3 概率密度函数的估计.ppt
- [工学]3-1 浅基础结构设计.ppt
- [工学]3 半导体三极管.ppt
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
文档评论(0)