- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML馆际异构数据集成系统研究及探究
基于XML馆际异构数据集成系统研究及探究[摘要]馆际异构数据集成系统是为了提高高校数字图书馆资源利用率、实现资源高度共享的一种方法。文章介绍了异构数据集成的基本方法,并根据XML技术的特点,重点分析和研究了基于XML的馆际异构数据集成系统的框架结构和系统实现的主要技术。
[关键词]异构数据;XML;请求处理;包装器
[中图分类号]G250.74 [文献标志码]A [文章编号]1005-6041(2012)03-0036-04
随着各高校数字图书馆建设的深入,不同学校根据本身的专业特色和课程特点,分别设计和购置了大量的数字图书资源供学生和教师使用,由于各高校数字图书馆相对封闭,各馆建设的时期并不同步,而且技术上采用的操作系统、网络结构、数据库结构等均不相同,因此产生了各种不同类型的数字信息资源,我们把这些数字信息资源统称为异构数据信息。由于异构数据信息的存在,使各高校图书馆之间难以实现数据信息共享,图书馆的数据资源也就成为“信息孤岛”。为了实现资源的有效利用以及馆际信息的高度共享,使更多的资源能够被不同学校的广大师生使用,集成异构数据库就成为当前数字图书馆迫切需要建设的内容。
1、异构数据集成概述
由于应用系统的不同,因此各应用系统的数据源无论是数据结构、表示方式也各不相同。异构数据集成系统就是要把各种结构不同的数据,通过逻辑、物理等方式最终都转化为一种统一的、结构相同的全局数据模式,能够让用户透明的访问这些数据源,实现全面的数据共享。数据集成的关键技术是忽略数据源平台和结构等异构性,将不同的异构数据转化成可以被识别和使用的统一数据进行描述,实现数据的无缝整合集成。一般的异构数据集成模型如图1所示。
在处理异构数据集成问题上,有以下难点需要解决:1)解决数据的异构性问题:不同图书馆的数据资源各有不同,这些异构性是由应用系统所决定的,是异构数据集成应用需要解决的首要问题,异构性对集成应用的影响不仅是物理上的系统结构,更重要的是数据的结构模式和表现方式。2)解决数据源的自治性问题:每个图书馆所拥有的数据源均对应着不同的管理系统,我们需要在数据集成后依然保持数据源的相对独立性,而不能因为数据集成而改变它们的常规操作,同时也不能因为集成而影响将来的数据升级和更新。3)解决用户的透明性访问问题:集成后的数据访问,不能因为集成而变得更为复杂,而应该和集成前一样,使用户能安全、稳定、透明的访问数据。
2、常用的异构数据集成方案
具体的异构数据一般分为:结构异构、语法异构、系统异构和语义异构四种。目前,使用比较多的数据集成方案主要有以下两种:
2.1 基于模式的集成方案
在基于模式的集成方法中,各数据源的数据位置保持不变,通过集成系统为用户提供一个虚拟的集成平台,并建立一套集成查询的访问处理机制。用户在访问数据时,可以直接在集成界面上提交请求,通过认证后由数据集成系统进行请求转换,将请求发送到本地数据库进行执行。
2.2 基于数据复制的集成方案
在基于数据复制的集成方案中,需要将各个独立数据源的数据进行集中管理,建立统一的数据源,同时要求这些数据源在更新时保持一致,以此来提高资源的利用效率。最基本的数据复制方法就是建立统一的数据仓库。其原理是将原有分散的、不连续的数据从不同的数据库中抽取出来,通过对数据进行分类加工,清理出冗余数据,然后对数据进行汇总统计,并建立一致的数据仓库,当用户访问数据仓库时,就像访问普通数据库一样。
以上两种方式均有优缺点。模式集成方法为访问者提供了方便的集成访问界面,因此当各分散的应用系统数据量比较多,并且系统数据更新较为频繁时,用户可以通过集成系统很方便的访问各数据源。但该方法由于本身只是提供虚拟界面,自身并不保存数据,当用户访问量较大时,需要更高的网络通道来对其进行支持,否则会造成网络延堵。而数据复制方法是通过集成系统对各数据源进行集中管理,并建立统一的数据仓库,用户在访问数据仓库时,可以很方便的通过集成检索到数据仓库中得数据,从而可以快速的提高用户的响应时间。但该方法也存在缺点,比如当各数据源数据更新时,需要把数据同时传递到数据仓库中,因此存在着一定的数据延迟,并且有时会造成数据的不统一。
3、基于XML的馆际资源数据集成研究
3.1 XML知识介绍
随着互联网技术的发展,基于Web的数字图书系统已经成为发展的趋势和主流,这些系统主要是由HTML来进行编写,由于HTML缺乏必要的结构和语义信息,给数据集成带来了很大的困难,因此在W3C(World Wide Web Consortium,万维网联盟)的组织和领导下,建立了统一的规范,即XML规范。XML是一种技术标准,它可以定义其他语言,同时XML还具有扩展性强、表现形式多样、与应用系统平台无关等优点
您可能关注的文档
最近下载
- 油田开发与分析研究知识问答汇编.doc VIP
- 2025陕西公需课党的二十届三中全会精神解读与高质量发展答案.docx VIP
- NFPA 110-2019 国外国际标准.pdf VIP
- 宿舍规章制度十条.docx VIP
- (2025)第九届全国中小学“学宪法、讲宪法”活动知识竞赛题库及答案.pdf VIP
- 严明党的纪律和规矩论述摘编.docx VIP
- 福建省福州第一中学2024-2025学年高一下学期第四学段模块考试(7月期末)数学试题(含部分答案).pdf
- DB36∕T 1601-2022 猪场粪污异位发酵处理技术规程.pdf VIP
- 甘肃白银有色集团股份有限公司招聘真题.docx VIP
- 《科研基金申请撰写策略》课件.ppt VIP
文档评论(0)