古籍目录索引的自动编制.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
古籍目录索引的自动编制

古籍目录索引的自动编制 ——以“中华古籍索引库”为例 包菊香 (国家图书馆 北京 100081) 摘 要 为了提高索引编制的效率与质量,利用计算机技术实现古籍目录索引自动编制,其重要性、必要性不言而喻。“中华古籍索引库”在古籍目录索引自动编制方面作出了有益的探索和实践。本文以“中华古籍索引库”为例,介绍索引编制过程中,索引条目抽取、编排等环节的工作思路及经验。 关键词 中华古籍索引库 古籍目录索引 自动编制 一、“中华古籍索引库”背景 古籍是中华文明的重要载体,是弥足珍贵的文化瑰宝。为了更好地了解我国现存古籍的保护状况、加强对古籍的保护和管理,国家于2007年初启动了“中华古籍保护计划”。其中,全国古籍普查登记工作是全面了解全国古籍存藏情况,建立古籍总台账,开展全国古籍保护的基础性工作。在古籍普查登记基础上,将由省级古籍保护中心组织本地区各古籍收藏单位编纂出版馆藏古籍普查登记目录,形成《全国古籍普查登记目录》。 各单位对馆藏古籍进行普查登记,形成Excel格式的《古籍普查登记表格》,在此基础上形成《××单位古籍普查登记目录》。各单位古籍普查登记目录按照每部古籍一个款目著录,为每部古籍赋予具有唯一性的款目编号——“古籍普查登记编号”,同时遵循简明扼要、客观著录原则,登记每部古籍的基本项目,必登项目有索书号、题名卷数、著者(含著作方式)、版本、册数、存缺卷数,选登项目有分类号、批校题跋、版式、装帧形式、丛书子目、书影、破损状况等内容。是否登记选登项目,选登项目的多少,将由各单位在保证必登项目的前提下量力而行。 各单位古籍普查登记目录的款目编排方式,国家古籍保护中心不作统一规定,由各单位自行决定。由此,使用者很可能因不了解具体编排方式,很难快速地在目录中查找到自己所要查找的古籍;各单位收藏古籍都是有限的,若使用者不清楚哪些单位收藏自己所要查找的古籍,从而将所有单位的古籍普查登记目录从头至尾翻检一遍,可想而知这是一项多么费时费力的大工程,将给使用者带来多大的不便。 因此,为各单位古籍普查登记目录一一编制索引,以及为《全国古籍普查登记目录》整个丛书编制索引,都是十分必要的。索引对于古籍目录的重要性显而易见。为目录编制索引,将极大提高目录使用的准确性、便捷性,提高使用者的使用效率。 但是我们也应清醒地认识到,索引的编制难度很大,如果是以手工方式为一部古籍目录编制索引,其工作量十分巨大,更不要说为全国两千多家古籍收藏单位的古籍普查登记目录一一编制索引,其工作量之大难以估量。同时,编制索引是一项精确性要求很高的工作,手工编制索引难免造成错误和遗漏,这将大大影响索引的精确性。针对以上两点,国家古籍保护中心考虑利用计算机技术,实现古籍目录索引的自动编制,由此专门开发了“中华古籍索引库”(以下简称“索引库”)系统。 二、索引自动编制的实现 各单位将Excel格式的《古籍普查登记表格》提交国家古籍保护中心。国家古籍保护中心将这些《古籍普查登记表格》导入索引库,利用索引库中的导出功能,将《古籍普查登记表格》中各登记项目按照一定的规则组织起来,导出为Word格式的《××单位古籍普查登记目录》。 在导出目录前,索引库允许用户选择是否附加题名索引或著者索引,允许用户选择索引的具体编排方式,如拼音、部首笔画、四角号码等。考虑到古籍题名与卷数的密切关系,题名索引中的题名是包含卷数的广义题名。索引库最多可以为一部目录附加六种索引,即“题名拼音索引”、“题名部首笔画索引”、“题名四角号码索引”、“著者拼音索引”、“著者部首笔画索引”、“著者四角号码索引”。 之所以为题名、著者各编制三套索引,主要考虑到普通读者、古籍专业读者的不同需求。四角号码索引是古籍目录中常用的一种索引方式,具有准确率高、查找速度快的优势,对于熟悉四角号码的古籍专业读者来说较为便捷。而对于普通读者来说,四角号码规则较多而难以快速上手,不易掌握,因此编制拼音索引、部首笔画索引,以方便普通读者使用,这也是必要的。 索引库要实现索引的自动编制,需要实现两大功能,一是索引条目的自动抽取,即从目录正文中抽取题名、著者,同时指明其所在页码或款目编号;二是索引条目的自动编排,即按拼音、部首笔画、四角号码等方式编排。 (一)索引条目的自动抽取 “索引条目”是指目录正文中的被索引对象,在这里即为题名、著者。索引条目后应指明其在目录正文中的页码或款目编号。考虑到古籍普查登记目录在以后排版过程中有可能造成页码的变动,索引库选择了款目编号——“古籍普查登记编号”作为索引条目的指向。 要从目录正文中抽取题名、著者,首先需要了解《古籍普查登记表格》的格式。在《古籍普查登记表格》中,“题名卷数”、“著者”为两列,若古籍为一题名一著者或一题名多著者时,可分别在“题名卷数”栏、“著者”栏中

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档