中国历代典籍总目分析系统介绍..docVIP

  • 5
  • 0
  • 约3.43千字
  • 约 9页
  • 2016-12-24 发布于重庆
  • 举报
中国历代典籍总目分析系统 (HBCC v1.0) 产品说明 中国国际图书贸易集团有限公司 北京大学数据分析研究中心 北京欣诺格科技有限公司 2010年8月 设计理念和定位 1、产品设计理念 “中国历代典籍总目分析系统”是由国家图书馆出版社出资建设、国家图书馆古籍馆和北京大学数据分析研究中心强强联合,历时两年研制的大型古籍文献目录知识服务系统,其设计理念是基于知识本体构建综合性古籍文献知识库。 国家图书馆和北京大学相关专家在对知识本体和国际图书馆协会联合会《书目记录的功能需求》标准展开深入研究的基础上,首次在文献领域采用实体关系分层描述古籍书目并构建古籍文献知识本体。按照古籍文献知识本体结构和时代分布情况,“中国历代典籍总目”综合分析存世文献著录数据和历史文献著录数据,避免了同类系统只针对存世文献进行检索分析的缺点,为实现“辨章学术,考镜源流”的目标奠定了基础。 2、产品定位 “中国历代典籍总目分析系统”全面汇总中国历代书目,全方位展现华夏五千年文明成果,堪称当代“历史艺文志”,也是全球首个“华夏历史e文志”。目前,本产品形成了包含总计240万条古籍文献书目信息的综合性古籍文献知识库,是全球收录最广、数据最全的权威汉籍目录数据库。并且,在古籍文献知识库的支持下,“中国历代典籍总目”除实现了基本的目录检索功能外,还能够通过在古籍文献中分析责任者、责任时间、责任行为、版本特征,以及装帧特征等多种维度的相关性,进一步揭示数据背后隐藏的丰富知识。是目前世界上具有划时代意义的古籍文献目录知识服务系统。 3、应用领域 ◇为普通读者提供基础文献知识服务,是古籍数字图书馆的重要组成部分; ◇为专业研究人员提供深层知识挖掘和知识重组等高级服务; ◇为全国古籍普查工作提供业务工具,提高普查工作效率; ◇为文化事业和商业经济提供有效的知识咨询服务。 产品简介 数据来源 该系统数据内容详细,数据关系完整,囊括了各类经典的汉籍目录,并且还在不断的扩充中。目录包括史志目录、官修目录、私藏目录、知见目录、公藏目录、专科目录、丛书目录、珍贵古籍名录等。书目内容包含品种信息、版本信息、印次信息和藏本信息等,每一条书目数据都处在由这些信息组成的多维知识数据空间中。 功能特点: “中国历代典籍总目分析系统”拥有强大的全文检索和高级检索功能。除支持繁简通检外,还支持以书名、书目范围、书目分类、书目层级、版本类型、版本时代、责任者、责任行为为条件,进行全文范围的书目信息检索。 “中国历代典籍总目分析系统”与其它系统的显著区别在于其具有强大的多维分析功能,其中最主要的多维分析功能之一即责任者相关性多维分析。同一书目著录的责任者之间通常具有很复杂的社会关系,在品种、版本、印次和藏本层次上,通过对这些责任者著录信息进行定量分析可以获得较多的学术传承、交游往来甚至姻亲关系的知识。同时,在海量数据的基础上,“中国历代典籍总目”还可以对书籍的成书年代、品种、藏地等进行多维分析,以获得定量的学术发展和研究重点的历史分布情况。 产品功能介绍 1、采用自然语言处理技术抽取古籍书目信息 本系统采用自然语言处理技术,先由计算机完成目录原数据的自动标注和切分,并在此基础上完成信息抽取工作和数据语义规范;然后,计算机通过专家知识自动分析结果中的问题,并以“纵向校对”方式组织数据提交人工审校。经过反复自动分析和人工校对,有效保证数据的质量。截止2009年10月,共对27部目录书进行处理,完成近210万条书目数据的处理。 2、基于语义的数据检索 为提高古籍书目检索的准确率和召回率(查全率),在数据处理语义规范的基础上,本系统实现了书名条件的语义检索。此外,为解决古籍分类法体系种类繁多、内容结构复杂、现代人难于掌握的难题,本系统完成了各种古籍分类法语义映射建设,实现了分类扩展检索功能。 3、实现专家知识固化与共享 系统首先根据专家知识,按照书目文献的知识体系结构,从不同知识维度组织数据,提供多种导航功能;在此之上,系统提供了检索方法保存共享机制,为进一步方便专家知识的共享与传播提供了保障,使该系统成为不仅是专家学者的学术研究工具,而且也是文献书目等专业的教育教学平台。 4、古籍文献责任者相关性分析 古籍目录中的责任者信息是研究责任者之间学术和社会关系的重要线索。系统以书目数据著录为桥梁建立了责任者之间的联系。在对责任行为分类的基础上,分组研究责任者间的学术和社会关系。 如图,以罗振玉为例,系统通过多维分析,发现他与王国维关系度极高,通过进一步研究发现,其关系多为互校、互序等,显示出他们是学术水平相当的师友关系。 5、古籍文献成书年代分布统

文档评论(0)

1亿VIP精品文档

相关文档