不完备信息系统中基于不可区分度的知识约简算法的程序设计与实现.doc

不完备信息系统中基于不可区分度的知识约简算法的程序设计与实现.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
不完备信息系统中基于不可区分度的知识约简算法的程序设计与实现.doc

山西大学论文 论文题目不完备信息系统中基于不可区分度的 知返约筒算法的程IO:计与实现 系 计算机与信息技术学院 计算机科学与技术 学习年限2005年9月至2009年7月 指导教师 学位级别 2009年5月23日 不完备信息系统中基于不可区分度的知识约简 算法的程序设计与实现 学生姓名: 指导教师: 内容提要由于不完备信息系统(含有缺省数据或不精确数据)普遍存在,近年来,对不完备信息系 统的研究已经引起了人们的广泛注意。但到目前为止,对基于不可区分度的不完备信息系统知识约 简算法的研究还集中在理论方面,缺乏实际成型、有效的应用程序或软件。本课题完成了不完备信 息表中基于不可区分度的知识约简算法和不完备决策表中基于不可区分度的相对约简算法的程序设 计与实现。本程序设计可作为该算法的辅助工具,具有实际意义。 关键词不完备信息系统,不可区分度,重要性,(相对)核,(相对)约简 1引言 粗糙集理论是一种处理不精确、不确定与不完全数据的新的数学方法,该理论己被广泛应用于 知识获取、专家系统、决策分析和决策支持等各种应用领域。知识约简是粗糙集理论处理信息系统 的重要手段。现实生活中存在着大量的不完备信息系统(含有缺省依或不精确数据),因此不完备信 息系统中的知识约简算法就具有重要的实际意义。 文U3j基于不完备信息系统提出了信息系统的可区分度和不可区分度的概念,给出了它们的重 要性质,并建立了二者之间的关系,并II证实了不完备信息系统的不可区分度和可区分度可退化为 完备信息系统的知识粒度与信息嫡。文[9]在文[13]研究的基础上提出了一种基于不完备信息系统的 知识获取方法,该算法将含有缺省伉的不完备信息系统的知识约简方法与多值信息系统的知识约简 统一起来,最终能得到不完备信息表的约简和不完备决策表的相对约简。到目前为止,对基于不可 区分度的不完备信息系统知识约简算法的研宂已经有Y大量的理论研究,但是还缺少实现它的软件 工具,这是这方而的研宄方14。 2基本原理 2.1基本概念 2.1.1不完备信息系统 一个信息系统是一个二元组S = ([/, A),其中 是对象的非空有限集合; A是属性的非空有限集合; 对有一个映射人,:f/^(2^-0),其屮2V“是人的幂集,0表示空集,每 一个属性集Pe A决定一个二元不可区分关系/;VZ)(P),即 IND(P) = [(x,y)eUxU\\/aeP9fa(x) = /“(’)} 易证,/A7)(P)是集合上的一个等价关系。关系PcA,构成了 的一个划分, 用(7//A?(P)表示⑽。 2.1.2相容类 令尸G/l,定义相容关系(满足自反性和对称性)如下: SIM(P) = {(x,y)eUxU}\yae P,乂 ⑽仍)*0} 用t//S/A/(P)表示分类,即为由相容关系S/M(P)决定的最大相容类集合。 2.1.3不可区分度 文[13]基于不完备信息系统(含有缺省数据或不精确数据)提山了信息系统的不可区分度/(A) 和可区分度ZXA)的概念,给出了它们的重要性质,并建立了二者之间的关系。 设S = ((7M)是一个不完备信息系统,(/二{;,x2,...,x|(7|}。则信息系统S关于4的不可区分度 定义为: I \u\ 7⑻= ⑻) 若(/ / (A) = A,则 1(A)可取得最小值 \U\/\U \2 = 1/| (7 | o 若t//S/M(A) = 且对Vx,),eCZ有pA(x,),) = l,则/(A)可取得最大值||7|f/|2=l。 不可区分度/(A)和可区分度D(A)的关系为/(A) + D(4) =1。其中D(A)定义为: 1 || D ㈧=7777[[1卜“5;㈧)] I I /=1 Z^DICi)表示决策属性集的条件可分度,定义为:£(Z)|C’)= Z)(DUC’)-Z)(c’)。 /(£|CZ)表示决策属性集的条件不可分度,且与D(£|CZ)关系为 2.1.4属性重要性度量 设S = (f/,C)是一个不完备信息表,C cC,任意属性ce C-C’关于属性集C’的重要性定义 sigd(c)=咏cU{(卜⑷⑻=D(C U{c})-D(C) 该定义表明,对一个属性集合,添加一个属性引起的不可区分度变化量越大,则该属性对此属 性集就越重要。因此可用它作力启发知识以减少搜索空间來寻找约简[9]。 设S = (t/,cuz))是一个不完备决策表,属性ce C相对于决策属性集D的重要性定义为: 抑(D(C) =砌二CHh (C) = D(D\ Cz)-D(D |CZU{C}) 该定义表明,属性在属性集屮的相对重要性由去掉它所引起的条件不可区分度的大小来度量[9]。 2.1.5 (相对)约简,(相对)核 令/?为一族等价关系,re /?,如果ind(R) = ind ( /?

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档