构建中医药数据资源结构图谱的探讨论文.docVIP

构建中医药数据资源结构图谱的探讨论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
构建中医药数据资源结构图谱的探讨论文.doc

  构建中医药数据资源结构图谱的探讨论文 .freelySQL、SQL、Access等不同的数据库物理模型或半结构、非结构的数据结构,而且在对资源的描述与揭示时没有采用元数据、数据元、数据模式等标准。数据库字段与数据表命名差异性较大,例如:“ZZ”表名对应数据字段名就有“主治”、“著作”、“作者”等。 1.3 数据来源多途径与数据版本复杂 中医药数据资源是指中医药科学数据中心与分中心收集的各类型专业数据,这部分资源数量众多,构成了学术数字资源的主体,现已成为重要的文献来源。从文献类型上看,有期刊、图书、会议论文、学位论文等;从文献级别上看,有题录、文摘、全文等不同的层次。自建数据库有多种载体、多种形式、多种类型、分散异构的信息资源,这些数据库形成时间长,数据更新多次,缺少清晰的资源定义与描述。 1.4 系统平台与应用程序各异 各种不同类型的数字资源有着不同的系统平台;不同的数据资源存在着过程数据的不同服务方式,例如:期刊文献数据库、结构型文献数据库、分析结构型文献数据库;同时,数据表存在着基础数据库、粗表数据库、细表数据库、单元素数据库等,部署在共建、共享的服务器上,也给数据管理带来麻烦。 2 数据资源与结构整合技术 2.1 数据资源整合 整合的实质就是各个单独事物共同遵循统一的原则、标准、规定,打破原来的界限形成有机的统一体。数据资源的整合1,英文可译作“digital resource integration”,就是通过各种手段和工具将已有的信息资源集成起来,并按照一定的逻辑关系进行组织,实现信息资源的有效共享,为用户提供条理化的信息服务,为后续信息的管理与使用提供规范,从而实现信息的增值利用。 数字资源整合主要集中在数据集的整合和应用的整合两个方面,再具体细分还可以划分为数据集成、信息集成、信息系统集成及业务(或工作流)集成等4个阶段。 通常数据资源整合的范围可以包括4个方面。①数据整合:数据标准、主题数据库、数据交换平台、基于语义的全局数据视图。②应用整合:使用统一用户认证、使用统一的数据交换、使用门户实现应用集成。③内容整合:信息规划、信息导航、统一搜索、信息专题、信息门户。④流程整合:统一数据采集加工处理流程、统一数据存储管理、统一数据访问和调用接口。 信息资源整合根据系统论的原则,依据一定的需要,对各个相对独立系统中的数据对象、功能结构及互动关系进行融合、类聚和重组,重新构建一个新的有机整体,形成一个效能更好、效率更高的新的信息资源系统。目前,数字资源整合的方式主要包括:基于OPAC资源系统的整合、基于数字资源导航的整合、基于异构数据库跨库检索的整合、基于数字图书馆应用系统的整合等。 2.2 数据资源整合技术2 2.2.1 DOI技术 DOI(Digital Object Identifier)由International DOI Foundation组织构造。该系统提供了一个框架,为数字环境中的数字对象分配唯一的、永久性的标识,方便该对象被管理和使用。DOI系统由4部分构成:申请DOI;创建对指定DOI对象的描述;解析系统;规则。 2.2.2 SFX技术 SFX即Special Effects Cinematography,它是比利时根特大学的萨姆堡尔为首的研究小组提出的。通过Open URL框架把复杂的数据库之间的互连通过简单的链接完成。 2.2.3 AP资源整合系统 INNOPAC公司推出的MAP (Millennium Access Plus)是一个集成的资源整合系统,它可实现不同信息资源的动态链接。这些资源包括全文电子资源、题录和文摘数据库、书目数据库、图书馆在线书目系统、图像数据库及搜索引擎等其他LS),其项目中有一个是关于生物医学机读信息资源的情报源图谱,其目的是利用超级叙词表和语义网络实现情报源与特定提问的相关性;有效组织信息资源,为用户提供特定信息源的范围、功能和检索条件等人工可读的信息;自动连接相关信息源;在一个或多个情报源中自动检索并自动组织检索的结果3。 3 构建中医药数据资源结构图谱 3.1 中医药数据资源结构图谱框架(见图1) 3.2 中医药数据资源结构图谱内容 3.2.1 物理层 系统运行的硬件、软件环境,解决如何为应用系统提供统一的支撑环境,支持应用系统的运作。 3.2.2 基础层 位于物理互连的网络协议之上,用于标准化、规范化描述数据,为更上层的数据交换提供基础性支持的标准、规范。基础性协议标准又可以划分为数据描述层面和数据访问层面。前者主要包括元数据、XML、RSS,后者主要包括开放数据库互连标准(ODBC)等。在数据描述层面内部,RSS具有提供内容聚合的功能,是为实现内容聚合而制定的一种信息描述、组织的规范,但它也具有资源发

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档