元数据仓储项目经验交流-数字图书馆推广工程.ppt

元数据仓储项目经验交流-数字图书馆推广工程.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
元数据仓储项目经验交流-数字图书馆推广工程

系统功能架构设计 针对不同的数据源,元数据仓储配置了相应的数据网关和采集适配器来实现对元数据的采集和处理,使得元数据仓储平台的资源采集模块能够根据系统预定义的元数据结构获取目标资源库资源的元数据信息。 在采集元数据前,需要根据各类资源的元数据建立对应的元数据模板,设定相应的元数据字段名称及数据类型。这项工作是通过数据网关来实现的。 元数据仓储包括元数据采集、元数据存储、元数据管理、元数据发布、元数据接口五个模块。 元数据仓储采集 元数据仓储的元数据采集模块设计 它的功能是抽取各类基础资源的元数据信息 构建的难点在于元数据的描述、存储及数据同步。 元数据仓储平台硬件环境 基于湖北省图书馆云平台 底层数据库:MYSQL数据库服务器2台,一主一备 内网应用:元数据仓储平台应用系统服务器 对外服务:资源整合检索服务系统,可扩展其他业务系统,如专题库系统。 湖北省图书馆现有数字加工的相关软件: ①元数据仓储平台获取图书自动化系统、媒资系统、已有特色库系统等其他业务系统的元数据; ②资源整合系统分析元数据仓储管理平台查询页面的数据信息来整合元数据仓储数据; ③资源整合系统与门户系统集成,实现门户检索资源的功能; 元数据仓储平台与相关系统关联 元数据采集对象分析 标准规范建设 建立关于数字化加工、资源描述、资源组织、资源互操作和资源服务等方面的标准和规范. 建成一个良好的元数据仓储,是信息服务的基础,只有拥有规范的和高质量的元数据,才有可能建成灵活实用的资源服务体系。 数字资源加工标准规范 数字资源唯一标识符应用规范 基本数字对象元数据规范 专门数字对象元数据规范 资源集合元数据规范 资源搜索、检索、调度和使用的标准 元数据加工 元数据发布 元数据同步更新 由于机构内各个专题库数据库结构各异,如果要设定数据库对元数据仓储服务器的自动上传,需要对每个数据库进行改造,因此我们采用主动的元数据同步方式,由元数据服务器定期检测对象数据库,进行增量同步。 对于已有的元数据库,可以通过元数据同步的方式将其同步到元数据仓储系统内。 完成2013年元数据仓储项目 体 会 元数据仓储建设将更快、更全的收集数据源中的元数据,转换成格式统一、结构清晰,可以按需分类的数据,并对数据进行再组织和管理。 元数据仓储建设使广大用户更快、更全面地发现资源、利用资源,为读者展示整个知识领域,由点及面,从而实现知识整合和知识搜索。 展望 * 我省数字资源建设以荆楚地方文化为重点,突出湖北地方特色、注重资源的针对性和实用性。 通过现代高新技术手段,整合湖北地区优秀文化及各类文化信息资源,建成互联网上的湖北地区文化信息中心和网络中心,实现湖北地区与全国各地的信息资源共建共享。 搭建湖北信息资源建设的基本框架,提供网上服务,实现湖北省馆与各市、县图书馆资源的共建共享。 * 2014年,我馆申报并建设完成: * 主要业务功能是根据各资源元数据规范构建元数据模板,利用元数据采集适配器从各类数据源中抽取元数据信息,实现元数据的采集、存储、检索和发布。 * 数据网关是从数据源提取元数据并组织成结构化数据的桥梁和纽带,数据源可以是数据库服务器、文件服务器、FTP服务器、web服务器以及用户录入的数据等。 数据网关是元数据仓储平台的前端子系统,因此数据网关需要提供一个通用的数据网关接口并且能够与各个采集适配器以及后端的数据库之间进行良好的交互通信。 * * 本地自建数据库 本地自建数据库是图书馆对内部资源进行加工整理而形成的专题或特色数据库,其表结构等数据库详细信息均可获得,因此对于此部分数据库的元数据获取相对容易。 数据库可以按照特定格式导出数据库内容。对于不同性质的数据库,如图书、期刊数据库,可以分别按照其元数据必备字段要求导出,导出的格式可以是xls、txt、xml等,但为了易于统一管理,我们通常导出xml文件。 分布式自建数据库 分布式自建数据库为其它合作图书馆或机构建立的数据库,其资源的数据库和对象文件不在本地。 这部分数据可以抽取其元数据信息保存到元数据仓储,当用户向本地WEB服务器发送检索请求时,查找到自己想要信息并调用其详细内容时,如果对象数据在本地,则直接在本机构内数据库中取数据返回到发布页面。而如果不在本地的,可以直接从异地数据库中取回数据返回到本地发布端,此过程并不会把异地数据中的数据取回来放在自己的服务器上,仅仅是同步显示在本地发布端。 商业数据库 我馆购买了大量商业数据库,这类数据库通常都已封装好,我们很难获得其元数据信息。 对于可以提供其元数据信息表的商业数据库,根据电子资源供应商提供的服务方式,可以通过开放Z39

文档评论(0)

busuanzi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档