信息集成中的数据源访问机制分析.docVIP

  • 6
  • 0
  • 约7千字
  • 约 14页
  • 2018-10-29 发布于广东
  • 举报
信息集成中的数据源访问机制分析.doc

信息集成中的数据源访问机制分析 [ ]从系统实现的角度,将信息集成中的关键 技术一一异构数据源的访问机制分为4类:基于HTTP 协议、基于标准接口协议、基于API以及基于本地数 据库接口的访问机制,对其基本原理、特点和使用原 则加以详细介绍,并对这些信息获取机制的优势和劣 势进行深入分析和对比,提供多种协议的选择原则, 简单描述其实现策略,以便对其进行封装后加以集成。 [关键词]异构数据源信息集成访问机制 [分类号]G250.76 1引言 随着计算机技术特别是Web的迅猛发展,越来越 多的数据在Web上发布,井具备比较便利的访问接口, 使用户可以方便快捷地获取各类信息。但是,由于数 据提供方及专业领域的不同,每个数据源几乎都是异 构的,因而它们之间的信息、组织和接口都不一样, 这就构成了一个巨大而复杂的异构数据环境。只有将 这些孤立的数据都集成起来,提供给用户一个统一的 视图,才有可能从巨大的数据资源中获取所需的东西。 为了集成这些数据,关键环节之一是将异构的访问接 口进行封装,屏蔽各种数据源的差异,使这些异构系 统“互联互通”。本文主要分析和探讨各类数据源的数 据访问机制,为进一步的接口封装奠定基础。 2异构数据源的访问机制分析 目前数据资源的结构及接口形式各异,所支持的 接口协议主要包括:HTTP、Z39,50、JDBC ODBC、 SOAP(Simple Ob—ject Access Protocol)、Web Service、 LADPfLightweight DirectoryAccess Protocol)等。 针对0前异构数据源所支持的协议集,可将访问 机制大致划分为4类:①基于HTTP的访问机制;② 基于标准接口协议的访问机制;③基于API的访问机 制;④基于本地数据库接口的访问机制。每种访问机 制均有其自身的特点及其适用范围,面对纷繁复杂的 网络资源,集成时需要针对各类资源的具体情况进行 区别对待。有些资源只支持一种访问机制,而还有一 部分资源则允许多种协议对其进行访问。每种连接技 术或协议都有其优点及缺点,因此,如果一种资源可 以通过多种连接方式获取,那么在数据访问模块中应 确定优选的连接方案。具体地说,通过HTTP协议可 以检索许多网络资源,但是检索结果的集成需要对网 页进行解析,因此它的结构性最差,应尽量采取其他 标准接口的协议,以保持系统的稳定性和标准化。通 过数据库接口软件与不同的数据库直接连接,在同时 检索的数据库数量较少时,使用此技术可在一定程度 上解决异构检索问题,但数据库达到一定数量时,处 理速度很难保证。这种方式仅适用于对属于本单位的 少量异构数据库进行统一检索。某些数据源本身提供 的检索接口 API,很容易识别和使用资源本身的元数 据。信息集成中应该在选择访问机制时综合考虑稳定 性、标准化、开放性等多种因素。为了封装各种协议, 必须对每种协议进行分析研究,以下笔者结合实际开 发经验,分析上述4类访问机制的实现技术。 2.1基于HTFP的访问机制 现有各种数据源都提供相应的客户端接口,因此 可利用HTTp访问机制向其发送检索请求加以集成。 HTTPjHyperText Transfer Protocol)协议,即超文本传输 协议,是 服务器使用的主要协议。它是一个属 于应用层的面向对象的协议,由于其简捷、快速的方 式,适用于分布式超媒体信息系统。HTrP协议基于请 求/响应方式,客户/服务器模式中信息交换的实现 过程主要包括建立连接、发送请求、发送响应和关闭 连接4个步骤。HTTP协议是支持信息集成的最基本协 议,通过它实现与分布式网络数据库、电子 等信 息资源的连接,执行检索与浏览操作。 在实际应用中,不同数据源的Web处理接口存在 很多细节上的差别,笔者对所掌握的各种情况进行总 结,归纳出以下差别: 2.1.1检索请求的发送方式大部分数据源都可以 同时支持GET请求和POST请求,但也有一些数据源 只接受POST请求,应进行区别对待。 2.1.2检索请求URL的分析成本大部分数据源的 集成都需要经过一定的人工分析,对它的检索机制要 有一定的了解,但有一小部分数据源的集成几乎是“零 成本”,即几乎不用进行分析就可以轻松集成。具体来 说,在数据源的检索页面中输入检索词,执行检索后 进入检索结果页面,包含各种参数的检索请求URL在 浏览器的地址窗口中完全呈现,检索引擎只需根据具 体情况改变检索参数值,以POST或GET方式向数据 源发送检索请求,即可返回检索结果。这种数据源可 以很容易地加以集成,伹这种情况非常少见。 大部分数据源在执行检索后,向用户呈现的检索 结果页面并不会直接将检索请求的所有参数显示在地 址栏中,而只是显示结果页面的基本URL,如果检索 引擎直接利用这个URL作为检索请求

文档评论(0)

1亿VIP精品文档

相关文档