- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网格环境下数字图书馆语义服务开发研究
网格环境下数字图书馆的语义服务开发研究
[摘要]针对数字图书馆中存在的资源整合、系统异构问题,对于如何建设基于语义网格的数字图书馆进行探索性研究。设计基于OWL-S框架的数字图书馆语义网格服务模型,确立数字图书馆语义网格服务模型体系结构,设计语义匹配算法及语义服务本体,采用Introduce等工具对网格环境下数字图书馆的语义服务开发进行实验性研究,实现并论证该模型的可行性。
[关键词]语义服务 语义网络 数字图书馆 OWL-S
[分类号]G250
1 引言
当前数字图书馆研究的主要趋势在于,构造一个逻辑的集成信息服务机制,以支持分布的数字信息系统之间的互操作,实现这些系统间无缝交换和共享分布的、多样化的信息资源与服务,从而形成基于集成信息服务的数字图书馆。但是目前的数字图书馆服务开发与建设还是面临很多的问题。
基于网格的数字图书馆屏蔽了信息资源的来源,解决了分布式异构资源的问题。各数字图书馆子系统将自己的服务在基于UDDI的注册中心注册后,服务请求者就可以通过调度中心来调用这些服务,检索来自不同地理位置的或不同存储结构的信息资源。但这种依靠xml技术的web服务并没有解决语义的问题,例如WS―DL只是从语法上描述了一个服务名称与部署情况,对于该服务具体实现什么功能,以及与其他服务有什么关系,却无法在xml文件中描述出来,这都还需要人工进行查看。如果让web服务具有语义性,就必须让计算机实现“理解”用户需要,自动地为用户选择正确的服务,还有可能让多个服务组合起来实现新的功能。
传统的数字图书馆的信息检索通常以查询关键字形式进行,这种简单的利用字或词之间的相似度来进行检索存在一定的局限性。因为存在有一词多义的情况,若输入的关键字不同,与用户请求相关的书目信息常常会因关键字的不匹配而不能被检索出来。这种利用关键字匹配的检索方式准确率较低,需要用户从一大堆检索结果中人工筛选自己想要的信息资源。如果计算机能从语义上识别用户的要求,代替人工的一部分工作,则可以提高检索的准确度。
鉴于现在的数字图书馆现状,本文???数字图书馆语义网格服务开发进行了一些探讨,并为建立基于OWL-S框架的数字图书馆网格服务模型提供一些新的思路。
2 数字图书馆语义网格服务模型的设计
2.1 语义检索
在数字图书馆的检索模块中,由于中文没有像英文那样使用空格分隔词语,这样导致在模糊检索时反馈给用户大量的无用信息,所以需要在检索模块时首先对用户输入的自然语言进行处理。语义检索可以改善单纯依靠“关键词匹配”检索的不足,它主要是在语义检索过程中采用中文分词技术对用户输入进行语义处理。语义处理过程如下:
2.1.1 中文分词 从分词粒度的划分、专有名词术语的识别、词语歧义的切分3个方面将用户输入的自然语言分成多个字或词的集合。现有的分词技术有基于字符串匹配、基于理解与基于统计3类,它们都需要中文词典的支持。目前提供了中文分词器的软件有Apache Lucene,它是个开放源码的搜索软件。本课题选用的是基于字符串匹配的分词技术,它是按照一定策略将用户输入的字符串与提供的词库中的词条逐个进行匹配,若找到相同的字符串则匹配成功,就将这个字符串提取出来。
2.1.2 析出关键词 即从上一步得到的字、词集合中找出具有检索意义的词语,包括名词、动词等实词。
2.1.3 同义/近义词扩充 从中文语义词典中查找关键词的同义或近义词,组成新的关键词集,进而实施检索。
2.2 语义web服务
语义web服务是利用本体概念从语义角度描述Web服务,它将服务以一种机器可理解的方式进行描述。OWL是W3C推荐的语义网中本体描述语言的标准,不仅能表达对象的含义以及对象间的关系,还添加了更多描绘对象类型和属性的词汇。而OWL-S是用OWL语言编写的本体,它具有规范定义的语义,可以用来建立规范化的web服务的本体。
在OWL-S框架中,它采用Service Profile、ServiceModel和Service Grounding 3个部分来描述一个web服务本体。虽然OWL-S本体解决了WSDL不能语义地描述web服务的缺陷,但是它缺乏像WSDL对消息的绑定功能。在实现语义web服务时可以将OWL-S与WSDL结合,不仅让web服务具有了语义性,还可以继续利用各种已有的针对WSDL开发的基于网络协议的信息交换软件。
2.3 数字图书馆语义网格服务模型体系结构
对于基于网格的数字图书馆的建设有好多项目组已经研究成熟,本课题采用的方案是在Globus网格平台中加入了语义调度模块的体系架构。第一层为表示层,接受用户输入;第二层为控制层,采用strut
文档评论(0)