基于XML树匹配构件检索算法研究与实现.docVIP

基于XML树匹配构件检索算法研究与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML树匹配构件检索算法研究与实现

基于XML树匹配构件检索算法研究与实现   摘要:针对构件检索的特点,结合模式分析中的树匹配思想,提出了构件树匹配模型,并在此基础上针对基于XML的刻面描述构件表示,实现了基于XML的树匹配构件匹配检索算法。该算法可以在保持构件查准率的前提下有效提高构件的查全率。实验结果证明了该算法的可行性与有效性。   关键词:刻面分类; 可扩展标记语言; 构件检索; 树匹配   中图分类号:TP301文献标志码:A   文章编号:1001-3695(2008)04-1013-03      随着软件复用实践的深入和软件构件库规模的扩大,软件构件技术研究得到了学术界和产业界越来越多的重视。构件表示与检索技术是可复用软件构件库的两个最重要的核心技术[1]。有效的构件检索机制能够降低构件查找和理解的成本,从而提高构件的复用率和软件产品的开发效率。??   刻面分类方式可以较大地提高检索效率,而且有助于复用者理解构件和目标领域,所以构件的刻面表示以及在此基础上的构件检索技术已得到软件复用界的重视。鉴于刻面描述构件表示方法已有成熟的理论和实践基础,XML规范天生具有极强的信息表达能力,它允许自定义标记,因此可以定义一套用于构件信息表示的标记语言来描述构件。??      1构件相关技术??      1.1构件相关概念??   目前对构件[2]的定义,在软件学术界和产业界还未形成统一的认识。广义上讲,构件是指可以被明确标志的软件制品,它可以是需求分析、设计、代码、测试用例、文档或软件开发过程中的其他产品。狭义上讲,软件构件是指可复用的、提供明确接口、完成特定功能的程序代码块(包括源代码、二进制代码或可执行代码)。构件库(component repository)是可复用软件构件的集合,主要目的是提供软件生存周期产品的重用机制以满足特定的软件代价(效益和生产率),并作为开发可重用软件构件和基于可重用构件开发这两个生存周期的联系体系。具体地说,构件库就是类似于用来存储、检索和管理构件的数据库,是开发可重用构件和使用可重用构件的中间媒介。??   1.2构件分类描述与检索??   对构件库中构件的合理分类和组织将有助于软件开发人员从构件库中迅速找到所需要的构件。目前,有很多关于构件的分类和检索方法, 根据复杂度和检索效果的不同可以分为基于文本、基于词法描述子和基于规约的编码和检索;从构件表示出发可以分为人工智能、超文本和信息科学三类方法。在实际应用系统中,基于构件的复用应用较为成功的是枚举、属性值、正文检索、关键词和刻面等几种,其中又以关键词分类和刻面分类[3]两种应用最多。??   构件检索方法主要归结为如下三类:??   a)基于外部索引的检索,如常见的关键词检索、刻面检索和基于属性的检索等。这类检索大多采用控制词典、属性等外部索引对构件进行检索。几乎所有的研究都认为提供自动化支持是必要的,自动索引、分层浏览和查询条件的简单规约和自动生成有助于提高效率、增加复用机会和提高复用质量。W.Frakes 的研究表明,各种分类法基础上的检索在辅助不同用户的理解上并无太大差异,需要考虑同一个系统中支持多种基于分类法的组合使用。??   b)基于内部静态索引的检索。根据构件自身的结构元素进行索引构件,以构件规约的语法和语义匹配技术等为主要方法。到目前为止,规约的语法匹配已研究得比较充分,语义匹配也形成了一般性方法。??   c)基于内部动态索引的检索。利用构件的可执行特征(如构件的输入与输出空间)进行检索,这类检索中常见的检索方法是基于行为的检索。由于实际应用的复杂性,目前基于行为的检索只停留在理论研究阶段。??   1.3构件刻面分类模式??   刻面分类模式[3,4]由一组描述构件本质特征的刻面组成,每个刻面从不同角度对构件库中的构件进行精确分类;每个刻面具有一组术语,术语之间具有一般/特殊关系而形成的结构化术语空间。刻面分类方法是从若干不同的维度描述复杂对象,具有枚举、属性/值和关键词等分类方法的优点。也正是其诸多优点使得它被NATO采纳和推荐使用,成为一种目前使用最为广泛的分类模式。??      2XML技术在软件构件中的应用??      由于XML规范具有极强的信息表达能力,它允许自定义标记,可以定义一类用于构件信息表示的标记语言(目前已有CML、CBL及IFX等数百种基于XML的自定义标记语言),将这套标记语言作为构件信息表示的规范。使用XML来表示构件信息具有六个优点[5]:a)可以使用最能反映构件信息特征的标记来表示构件信息;b)有助于构件信息进行合理的分层和组织;c)准确地定义构件信息的数据类型;d)当信息实体间有内在关系时,可以定义这些实体间的约束关系;e)当所描述的构件信息必须满足某种模

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档