粗糙集的知识表示.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
粗糙集的知识知识表示 信息论的度量主要任务是:度量颗粒性只是属性特征的重要性和属性特征之间的相依性程度。 主要内容: 信息论的度量:信息熵,条件熵和互信息引入粗糙集理论,揭示知识粗糙性和信息之间的关系。 1 粗糙集中的知识表示 知识表示是人工智能和智能信息处理的首要问题。 基于粗糙集理论的知识表示的着眼点:知识时一种对事物的分类能力。 知识表达系统可看成关系数据库,关系表的行对应要研究的对象,关系表的列对应对象的属性,对象信息通过指定各对象的各属性值来表达。 1.1定义:知识系统 称四元组是一个知识表达系统,其中, U:对象的非空有限集合,称为论域; A:属性的非空集合 V:全体属性的值域,; F:表示的一个映射,称为信息函数。 信息系统常简记为:(U,A)。 知识表达系统主要有两种类型:一类是信息系统(信息表),即不含决策属性的知识表达系统;另一类是决策系统(决策表),即含有决策属性的知识表达系统。 在Pawlak模型中,关系数据库的一个属性对应一个等价关系。一个关系数据表可以看作论域U和U上的一簇等价关系的二元序偶,即一个知识库或者近似空间。 知识约简可转化为属性约简和属性值的约简。 信息系统和决策表的举例: 2知识约简原理 在知识表达系统中,知识约简考察的是信息系统或决策表中给出的所有知识是否都必要。一般而言,知识表达系统中含有冗余的知识和信息。 约简任务之一就是保持原始信息系统或者决策表的分类能力不变的前提下,删除知识表达系统中冗余知识。对信息系统而言,这一过程为知识约简;对决策表而言,这一过程为知识的相对约简。 决策表中所有条件属性对于决策而言并非同等重要,甚至有些属性是不必要的,也就是冗余的。通常,在信息系统和决策表中存在两种类型的冗余:1)属性从整体的角度而言存在冗余;2)从整体上讲某个属性是必要的,但某些对象在该属性上的取值可能存在冗余,即属性值的冗余。 2.1 知识表达系统系统的知识约简 1 信息系统中知识约简的一般步骤 删除表中重复对象 删除冗余的条件属性 删除每个对象的冗余属性值 求出其约简。 2 决策表中知识约简的一般步骤 根据其约简,求出决策规则。 1.2 不相容决策表的知识约简 对于不相容决策表,粗糙集理论的处理方法是对每一个决策概念,计算其上、下近似。从其下近似导出的规则是肯定成立的,称为确定性规则;从上近似导出的规则可能是成立的,称为可能性规则。前者用于逻辑推理,后者有实例支持。 1.3 代数表示 粗糙集理论的重要作用之一:提供了一种有效的从数据中获取规则的方法和工具。知识约简种,核与约简是其中最重要的概念。在Pawlak模型中,这些概念是通过代数表达式定义的,也称为代数表示。例如:不可分辨关系,属性的必要性和相对必要性,属性的独立性和相对独立性,正域和相对正域,核与相对核,约简与相对约简,核与约简的关系等都是代数形式描述的。 1.4 知识粗糙性的信息表示 粗糙集理论将知识定义为关于论域的划分模式,从而使知识有了颗粒性,称其为信息粒度或知识粒度,简称粒度。 知识粗糙性是相对于两种知识粒度的比较。在粗糙集理论中,知识粗糙性是通过代数数学中的等价关系和集合包含关系来定义的。 本节讨论:知识粗糙性和信息之间的关系。首先,建立知识与信息熵及互信息之间的联系;其次论证信息熵及互信息都是随着知识粗糙性的增加而单调下降,通过反例证明它们之间的逆关系一般不成立;最后讨论逆关系成立的条件。 1.4.1 知识粗糙性 知识粗糙性通过数学中的等价关系和集合包含关系定义。 定义 设是两个知识库,如果下式成立: 则称知识P比知识Q较细,或者Q比P较粗,记作。 1.4.2 知识的信息熵与互信息 为探讨知识粗糙性与信息之间的关系,首先需要建立知识与信息之间的联系,定义知识的信息熵与互信息。 在粗糙集理论中,知识被理解为关于论域的各种划分模块。 粗糙集意义下的知识可以被视为随机变量。 知识的概率分布 设U为论域,P和Q分别为论域U上的两个等价关系簇。将P和Q看作是定义在U的子集组成的代数上的两个随机变量,其概率分布可通过如下方法确定: 设P和Q在论域U上导出的划分分别为X和Y,其中 则:(1)P和Q在论域U的子集组成的上定义的概率分布为: P和Q的联合概率分布为: 2 知识的信息熵和互信息 定义 知识P的信息熵H(P) 给定知识P和它的概率分布,则称 为知识P的信息熵,简记为H(P)。 定义 知识Q相对于知识P的条件熵H(Q|P)给定知识P和Q以及它们各自的概率分布和条件分布,则称 为知识Q相对于知识P的条件熵,简记为H(Q|P). 定义 知识P与Q的互信息I(P;Q) 给定知识P和Q以及它们各自的概率分布和条件概率分布,则可以计算得到信息熵和条件熵,且称为知识P和Q的互信息,简记为I(P;Q)。 信息熵度量了信息源

文档评论(0)

我思故我在 + 关注
实名认证
文档贡献者

部分用户下载打不开,可能是因为word版本过低,用wps打开,然后另存为一个新的,就可以用word打开了

1亿VIP精品文档

相关文档