增量式知识获取算法综述.docVIP

  • 4
  • 0
  • 约8.56千字
  • 约 13页
  • 2017-12-25 发布于江西
  • 举报
增量式知识获取算法综述

增量式知识获取算法综述 增刊 2007年6月 重庆邮电大学(自然科学版) JournalofChongqingUniversityofP0stsandT(NaturalScience) Supplement Jun..2007 增量式知识获取算法综述* 王利,张喜平,郭林 (重庆邮电大学计算机科学与技术学院,重庆400065) 摘要:粗糙集理论研究中对求解属性的最小约简或较小约简以及求取最简规则集的算法已经进行了一些研究. 而数据库是动态的,为了获取最小决策规则集,当增加新数据时,传统的方法通常需要对数据库中所有数据重新计 算,效率欠佳,因此对动态数据进行增量式学习是非常必要的. 关键词:增量式学习;新增记录;规则集 中图分类号:TP311.12文献标识码:A文章编号:1673—825X(2OO7)增一0099—04 Reviewofincrementallearning WANGLi,ZHANGXi—ping,GUOLin (CollegeofComputerScienceandTelchnology,ChongqingUniversityofPostsandTe1ecommunications,Chongqing400065,P.R.China) Abstract:Inrecentyears,manyroughsetbasedalgorithmsforcomputingthesmallestorsmallerreductionofat— tributesandknowledgeacquisitionaredeveloped.Theyarealmostbasedonstaticdata.However,realdatabasesare alwaysdynamic.InordertOfindaminimalsetofrulesforadecisiontable,theclassicalmethodcannoteffectively dealwithnewinstancesaddedtOtheuniverse,becauseofrecalculationfortheoverallsetofinstance.Incremental learningofdynamicdatabasesisverynecessay. Keywords:incrementallearning;newinstance:ruleset 0引言 作为一种特殊的智能系统,人脑对知识的学习 和发现能力特别强,它可以在原:有知识的基础上不 断学习新的知识,对知识具有可积累性,可重用性和 可增长性.人脑的这种学习方式在处理某些问题时 是必须的,例如,当我们在大学学习高等知识的时 候,不可能把小学中学学过的知识和大学知识一起 进行重新学习,只能根据大学知识对原有知识结构 进行更新和添加.为了模拟人脑的这种特性,人工 智能领域的研究者们做了大量的工作.Schlirnmer 和Fisher设计了ID4决策树归纳算法[1],刘宗田 等提出了属性最小约简增量式算法[3],王志海等提 出了概念格上的渐进式算法]等等. 1增量式学习的优势一 增量式知识获取算法是一种特殊的规则生成方 法,所以它不仅可以应用于其他非增量式知识获取 算法应用的地方,而且它对以下3种问题具有独特 的优势. (1)海量数据的处理.如何处理海量数据一直 是数据挖掘中的重要课题,而传统的知识获取方法 对海量数据处理极其缓慢.应用增量式知识获取算 法,我们可以把原数据表分成几段,先对一段进行学 习,再把其他段依次增量式学习进来.或者,可以对 几段数据表分别进行学习得到几个容量小的规则 集,再把各个规则集作为新的数据集应用于增量式 知识获取算法中. (2)无原始数据表的情况.在现实应用中存在 一 种情况,这种情况下我们的原始信息只有规则集, 而没有原始数据表.例如,在一些医疗专家系统中, 知识是以规则的方式进行存储,病例库由于过于庞 大或者不存在而不作处理.这种情况下,当学习新 的知识时,我们无法用传统的数据挖掘方法进行处 理,但可以采用增量式知识获取算法,例如把学习记 录作为一条规则加入规则集或者仅仅通过降低匹配 规则I的可信度等方法对规则集进行更新. (3)实时性要求比较高的情况下.在实时性要 * 收稿日期:2007—03—21 作者简介:王利(1980一),女,山西人,硕士,助教,研究方向为人工智能.E-mail:wanglib@.ca ? 1OO?重庆邮电大学(自然科学版)增刊 求比较高的应用环境中,把当前学习数据和所有数 据进行全部学习是不可能的,这只有应用速度更快 的增量式知识获取算法. 2目前的研究状况 近几年在粗糙集理论研究中对求解属性的最小 约简或较小约简以及求取最简规则集[5.的算法已 经进行

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档