- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2007年学术年会论文
构建中医药数据资源结构图谱的探讨,.c
尹爱宁何前锋张慧敏△
中国中医科学院中医药信息研究所100700
△浙江大学计算机学院
本文通过分析中医药数据库资源的类型、特点和中医药资源存在的问题,提出了基于现
有数据库资源与结构,并参考现有资源整合技术,从数据层、物理层、基础层三个方面入手,
并结合体系构建等相关的资源深层整合技术,探讨构建中医药数据资源结构图谱的实际解决
方案。
随着因特网和计算机技术的飞速发展,数字化的信息正在迅猛的增长。根据加利福尼亚
大学伯克利分校信息管理和系统学院的行业分析家的预计间产生的数据比
历史的全部数据的总和还要多,相关的研究人员还发现,全球每年产生的不重复信息量在
l20PB之间。如何实现数字资源清晰化、物理存储整体有序化、数据应用层次的合理化;
解决数字资源的整合问题成为最重要的研究领域之一。
l中医药数据资源现状与问题
中医药数据库建设工作起源于1985年,建立覆盖中医药学科的复杂的多类型数据库,
总数据量约200G,文献数据库收集年代跨越58年。数据库建设主要包括单表数据库、结构
性数据库和数据平台的建设。目前,中医药现代资料数据库的建设已经具有一定的规模,已
经形成以中医药科学数据中心与分中心为主体的中医药文献型及事实型数据库群,几乎涉及
到中医药信息的方方面面。
然而这些资源库群是彻底异构的,从数据结构、操作系统,到数据库系统,到应用系统;
从命名方式,到数据格式,到结构模型,到用户界面,都有可能完全不同,目前没有多少标
准规范能够对这个各个层次的异构进行适当的约束,中医药科学数据中心缺少完整解决方
案。
1.1局部有序、整体无序
从某一种具体资源的角度来看,他们都是经过一定程度加工整序,具有统一的分类体系
和检索界面。但从全局的角度来,中心拥有的各种资源是一个个的“信息孤岛”,各种资源内
容交叉,信息重复,关联度低, 用户查找资料时不但要在多个数据库中来回穿梭、重复操
作,还要精通各种不同数据库、不同界面的数字资源系统检索技术,否则便难以查全或查准
所需要的资料。
1.2数据结构与标准不统一
93
2007年学术年会论文
模型或半结构、非结构的数据结构,而且在对资源的描述与揭示时没有采用的元数据、数据
元、数据模式等标准。数据库字段与数据表命名差异性较大,例如:‘ZZ”表名对应数据字
段名就有“主治”、“著作”、“作者”等。
1.3 数据来源多途径与数据版本复杂
中医药数据资源指是由中心与分中心收集的各类型专业数据,这部分资源数量众多,构
成了学术数字资源的主体,现已成为重要的文献来源。从文献类型上看,有期刊、图书、会
议论文、学位论文等;从文献级别上看,有题录、文摘、全文等不同的层次。自建数据库有
多种载体、多种形式、多种类型、分散异构的信息资源,这些数据库形成时间长,数据更新
多次,缺少清楚的资源定义与描述。
1.4系统平台与应用程序各异
各种不同类型的数字资源有的不同的系统平台;不同的数据资源存在着过程数据的不同
服务方式,例如:期刊文献数据库、结构型文献数据库、分析结构型文献数据库:同时数据
表存在着基础数据库、粗表数据库、细表数据库、单元素数据库等,部署在共建、共享的服
务器上,也给数据管理带来麻烦。
2数据资源与结构整合技术
2.1数据资源整合
整合的实质就是各个单独事物共同遵循统一的原则、标准、规定,打破原来的界限形成
resource
有机的统一体。数字资源的整合【2】,英文可译作“digital integration”,就是通过各种
手段和工具将已有的信息资源集成起来,并按照一定的逻辑关系进行组织,实现信息资源的
有效共享,为用户提供条理化的信息服务,为后续信息的管理与使用提供规范,从而实现信
息的增值利用,实现数字资源的整合空间范围和基于知识内容的相互联系的整体揭示。
数字资源整合主要集中在数据集的整合和应用的整合两个方面,
文档评论(0)