- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
古籍索引数据的应用的研究
古籍索引数据的应用的研究
摘 要 古籍索引数据包含古籍电子索引和其他具有索引功能的古籍元数据。两者在基本性质、数据结构、加工方式、学术含量等方面差异明显,但是可以在一定条件下实现相互转换。古籍索引数据能够支持资源揭示、文本碎片化、数据挖掘、创建新数据等应用。
关键词 古籍 索引 数字化
分类号 G255.1
DOI 10.16810/ki.1672-514X.2017.05.×××
Abstract The index data of ancient books includes digital index of ancient books and other metadata of ancient books which has index functions. They are different from the aspects of basic features, data structure, processing methods and academic quality and so on. The format of the index data of ancient books can be mutually transformed under the certain conditions. The index data of ancient books can support the application of the resource description, the text fragmentation, data mining, and the creation of new data.
Keywords Ancient books. Index. Digitization.
索引是?δ持只蚰骋晃南准?合中所包含的各篇文章,或所讨论的各个局部主题,或所涉及的各种事项(如地区、人物等)以简明的方式分别著录标引,为用户提供便捷检索服务的工具[1]。在《索引编制规则(总则)》(GB/T 22466-2208)中,索引定义为指向文献或文献集合中的概念、语词及其他项目等的信息检索工具,由一系列款目及参照组成,索引款目不按照文献或文献集合自身的次序排列,而是按照字顺的或其他可检的顺序编排。按索引在文献检索中的功用分,可分为文献内容索引、文献篇目索引;按索引的标目分,可分为主题索引、著者索引、名称索引、地名索引、题名索引、代码索引、关键词索引、全文索引、引文索引等[2]。
古籍索引是揭示古籍内容的一种特定形式,是将古籍中的有关事物名称、篇名、字句、词语、人名、地名、内容主题等分别摘录标引,注明出处、页码与行数,并按一定的排检方法编辑而成,供人们查寻有关古籍文献的内容[3]。陈东辉在《二十世纪古籍索引编制概述》[4]《台港地区所编古籍索引综述》[5]《试论日本所编的中国古籍索引》[6]《欧美中国古籍索引编制概况》[7]等文章中梳理了我国古籍索引发展的脉络,同时概述了台港地区、日本、欧美等汉籍索引编制的情况。毛建军在《古籍索引的电子化实践》[8]《古籍索引电子化与古籍图谱数据库的建设》[9]《古籍索引研究20年回顾及其电子化趋势》[10]等文章中讨论了我国古籍电子化的发展现状。黄建年在《中国古籍索引编制软件概述》[11]《基于VFP+Word的多文本古籍索引编制实验》[12]《汉文古籍索引自动化实践与研究概述》[13]等文章中综述了我国古籍索引编制软件及古籍索引自动化方面的研究与实践。
古籍索引电子化是指古籍索引编制过程的计算机化,其内涵包括两个方面:一是用计算机编制的各种纸质形态的古籍索引;二是用计算机表达的古籍索引系统[9]。古籍索引电子化的成果即为古籍电子索引、索引电子版或索引数据库(以下通称为古籍电子索引)。与之相关的研究中,经常涉及古籍全文检索系统,一些研究者甚至把古籍全文检索系统与逐字索引相提并论。然而,两者的区别显而易见。古籍全文检索系统通常由检索软件和数据库组成,数据库中至少包含古籍文本数据和索引数据。只有古籍全文检索系统中的索引数据才具备索引功能,可与逐字索引进行比较。
1 古籍索引数据
狭义的古籍索引数据即古籍电子索引,而广义的古籍索引数据是具有索引功能的古籍数据。在古籍数字化领域中,常见的古籍数据包括目录数据、索引数据、图像数据、文本数据等,并在此基础上形成了目录库、图像库、全文库、资料库、知识库等,与相关软件一起构成古籍数字化资源系统,实现显示、检索、浏览、下载等功能。这里的索引数据即广义古籍索引数据(以下简称古籍索引数据)。
古籍索引数据既包含古籍电子索引,也包含其他具有索引功能的古籍元数据,如古籍图像标引数据、古籍全文
原创力文档


文档评论(0)