基于粗糙集理论的知识获取研究及应用-计算机软件与理论专业论文.docxVIP

基于粗糙集理论的知识获取研究及应用-计算机软件与理论专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要 摘要 基于粗糙集理论的知识获取研究及应用 基于粗糙集理论的知识获取研究及应用 I I PAGE PAGE IV 摘 要 知识获取就是通过一定的技术手段从海量数据库中发现潜在的、有价值的信 息,并以此为人们的行为提供辅助决策。现实生活中的数据不可避免地存在重复、 遗漏和不一致等问题,给知识获取的研究带来了难题。粗糙集理论作为一种处理 含有噪音、不精确、不一致数据的有力工具,它不需要提供相关数据集合外的任 何先验信息,适用于发现数据中隐含的规律,找出数据内部的关联关系以及特征。 粗糙集的这些特性使其能很好地对知识获取的过程进行处理。经过二十多年的完 善和发展,粗糙集理论成为软计算方法的一个重要分支,已经成功应用到模式识 别、机器学习、决策分析和知识获取等领域。 本文简单介绍了粗糙集和知识获取的发展、研究现状以及相关的基础理论知 识,着重讲述了知识获取中的数据预处理、属性约简和决策规则的提取,并结合 医学数据说明知识获取在实际生活中的应用价值。本文要点如下: (1)知识获取中的数据预处理。数据预处理是知识获取的重要步骤,只有提 供完整、准确、整洁的数据才能保证获取知识的效率和最终结果。文中针对决策 表的补齐和离散化,介绍了数据预处理中的几种方法,如平均值填充法、条件组 合完整化方法、利用领域知识填充法以及一种基于可辨识矩阵的离散化算法。该 离散化算法是将区分两个实例不同的不分明关系的任务让其中一个断点来执行, 这样既可以保持信息系统中不分明关系的不变,又能以最少数目的断点集把实例 中所有的不分明关系区分开。 (2)知识获取中属性约简算法的研究是本文的一个重点。首先,简单介绍了 几类主要的约简算法,如基本算法、基于可辨识矩阵的约简算法、基于属性依赖 度的约简算法等。其次,对基于可辨识矩阵的约简算法进行了深入分析和研究, 在此基础上提出了一种矩阵约简改进算法。改进算法中给出了一种属性频率函数 的定义,并考虑了可辨识矩阵中项的长度对属性重要性的影响,通过比较属性函 数值以及对应项的长度来确定属性的重要性。算法中将可辨识矩阵中单元素集合 项中的属性直接加入约简集,否则不断选择属性重要性比较小的属性进行补运 算,直到出现单元素为止。最后,给出了该算法的完备性证明并编码实现了原来 的一个矩阵约简算法和该改进算法。通过引入UCI 数据集对两个算法进行比较分 析,实验结果表明本文提出的改进算法能得到更小、更优的约简集。 (3)知识获取中决策规则的研究。经过属性约简后得到的每一条记录其实就 对应着一条规则。但是,得到的规则必须经过规则提取也就是值约简的过程才能 去除规则中的冗余条件。文中介绍了一种相容决策表的规则提取算法,同时指出 对于不相容决策表,隶属度、覆盖度以及阈值选择的不同将直接影响着最终决策 规则的生成。对于大数据集,隶属度和覆盖度在规则提取中存在一些不足。文中 指出结合可信度因子和阈值进行规则提取,并给出实例说明了其优越性。对得到 的概率性规则进行研究是本文的另一个重点。通过比较得到的高概率性规则以及 相关的确定性规则,可以得到一些有价值的信息。文中对这些有价值的信息进行 了描述,并给出了一种较为高效的基于局部可辨识矩阵的求解算法。最后,结合 医疗数据说明了其在现实生活中的应用价值。 关键词: 粗糙集,知识获取,属性约简,可辨识矩阵,决策规则 Ab Abstract 基于粗糙集理论的知识获取研究及应用 基于粗糙集理论的知识获取研究及应用 III III PAGE PAGE IV Abstract With the development of information era, large amount of information data is accumulating rapidly in every field of life. People use information data is not just for recording but for finding the valued knowledge that embedded in data from databases. The main purpose of knowledge acquisition is to find the knowledge from such large databases by technology and use the knowledge to help people making decisions. However, in our real life it is inescapable that there are redundant, missing, uncertain and inconsistent dat

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档