基于XML案例表示和案例库构造方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML案例表示和案例库构造方法

基于XML案例表示和案例库构造方法   摘要:将基于案例推理(CBR)技术与XML结合,提出了基于XML的案例表示方法,给出了DTD定义,分析了它与传统数据库相比的优势,并以Snort规则的基于XML的案例化为例,证明了该方法的有效性。所做工作为CBR的研究提供了一些新的思路。   关键词:基于案例的推理; 可扩展标记语言; 案例表示; Snort   中图分类号:TP311.13文献标志码:A   文章编号:1001-3695(2007)11-0070-04      0引言??      基于案例的推理[1,2]是20世纪90年代初人工智能领域新崛起的一种基于知识进行问题求解的学习方法。它是通过检索案例库中与当前问题相类似的案例,经过修改,为当前问题提供解的一种推理模式。由于CBR的思想较好地模仿了人类解决问题和不断学习的方式,大大提高了问题求解的效率。在出现不到三十年的时间里,CBR方法在工业的自动纠错系统、商业的销售系统、辅助医疗系统、综合评判和决策领域中已得到了广泛的应用。??    XML是互联网联合组织(W3C)创建的一组规范。它并不是一个独立的、预定义的标记语言,使用者可以定义无穷无尽的标记来描述文件中的任何数据元素,从而突破了HTML固定标记集合的约束。良好的数据存储格式、可扩展性、高度结构化和便于网络传输等特点使XML成为了新一代的Web语言。??   随着应用的不断深入,案例的结构越来越复杂,内容也更加抽象。非结构化已经成为实际应用的案例中普遍存在的性质。为了解决复杂的非结构化案例的表示、检索与推理,推动CBR广泛深入的应用,本文充分利用XML技术在对象描述与可计算性等方面的优势,将CBR技术与XML结合在一起,提出了基于XML的案例表示方法。??      1基于XML的案例表示和案例库构造??      1.1案例表示和案例库构造概述??   一个智能系统的智能性很大程度上取决于知识的数量及其可用度,要用计算机模拟人类智能,就必须把所需要的知识以适当的形式表示出来并存放到计算机中。基于案例的推理首先要研究的是怎样把过去解决问题的实例以案例的形式表示,以便存储在案例库中[3]。这就是案例表示和案例库构造的任务。??   案例表示实际上就是对知识的一种描述,即用一些约定的符号把知识编码成一组计算机可以接受的数据结构[4]。同一案例可以有不同的表示形式,而不同的表示形式产生的效果又可能不一样。合理的案例表示可以使问题求解变得更加容易、高效;反之,则会导致问题求解的麻烦和低效。从问题求解的角度来看,案例应该包含对问题的整体情况的描述,还应该包含对问题的解或解决方法的描述。所以一个典型的案例一般可以用一个有序对〈问题的描述,解的描述〉来表示。案例库可表示为      1.2基于XML的案例表示和案例库构造   1.2.1基于XML的案例组成??   XML是一组用来创建描述数据的语法标签的规则集。一个XML元素是由开始标签、结束标签以及标签之间的数据构成的。开始和结束标签用来描述标签之间的数据。XML文档是文本的形式,使用标志和属性来描述数据的性质,采用树型结构。XML面向数据,用于描述数据本身的性质与结构,能够同时描述数据之间的关系还能够存储数据。这就使得以XML为基础建立带有半结构化数据的案例库成为可能。以XML规范为基础的案例结构设计可以比数据库中表的设计更加精细,并能以数据存储结构反映案例的物理结构。XML文档的树型结构正与案例库结构中的分层次多子系统的结构相适应。XML文档中的节点自定义功能则有助于建立新的案例描述和功能。??   基于XML表示的案例包含两个主要文件[5]:一个用来描述研究领域的案例结构;另一个描述案例本身。图1反映了基于XML描述的案例的组成。      1.2.2基于XML的案例化方法??   鉴于CBR方法常用于增强基于规则的系统的搜索和推理能力,而且在这种应用场合,通常以已有的规则集为基础来构造CBR的案例库。因此,本文重点研究对规则进行基于XML的案例化的方法。由于已有的规则通常以特定的语言或预处理语言为表现形式,只需精确匹配而对组成规则的特征不作严格筛选;相反,CBR的相似匹配则需要精简用于匹配的特征以提高搜索效率和匹配准确率。对规则进行基于XML的案例化的过程应该包括图2所示的步骤。??   图2由规则构造案例库的步骤   规则分析和特征抽取是对规则进行分析,抽取其主要的共同特征,以便基于这些共同特征来将规则转换为非结构化的案例。案例结构定义是用来描述研究领域的案例结构,一般采用DTD(document type definition)或XML schema模式定义语言,它们不仅可以定义XML 文档的结构而且还允许约

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档