- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论古籍数字化的检索问题
郭伟玲
(武汉大学信息管理学院 湖北 武汉 430072)
摘要:本文通过介绍古籍数字化建设过程中容易出现的问题,联系当下古籍数字化产品中所出现的检索瓶颈,探讨从古籍整理、古籍数字化加工、古籍数字化项目的管理规划等方面促进古籍检索的发展
关键词: 古籍数字化 检索技术
Abstract: This paper describes frequently problems that happened in the digital construction process of ancient books, with contemporary search bottlenecks that emerged in the digital ancient resource product, and then explores the solution to promote the development of search for ancient books digitization from the aspects of the ancient books reorganization, ancient books digital processing, and the management and planning for projects of ancient books digitization
Keywords: ancient books digitization retrieval techniques
进入二十一世纪以来,我国的古籍数字资源的建设呈现出一种新的气象,古籍数字化工作中的基础工作建设也得到了空前的重视,国家层面上提出了建设《国家数字图书馆标准规范》,其中设定了子项目《我国数字图书馆标准规范专门数字对象描述元数据规范》,针对中文数字资源的特点,选取具有中国文化特色的文献资料类型(如古籍、拓片、舆图等),通过试验研究,最终确定揭示和描述这些对象内容及其特性要采用的元数据标准,建立元数据格式及其扩展和互操作规则。古籍数字化的理论表述逐步成型,古籍数字化的学科体由北京大学教授刘俊文策划北京爱如生数字化技术研究中心开发制作2005年10月完成21世纪以来,古籍数字化发展迅猛,至今已有一万多种古籍实现了数字化,这些成果已构成了一个庞大精深的中华文化立体知识体系。在此基础上建设的数据库,不仅可以实现海量信息查询、字词频分析,用字量统计等古人难以实现的功能,在检索技术上的进步也非常显著。众多古籍数据库不仅仅满足普通数据库所必备的常见检索功能,如全文检索、关键词检索、布尔逻辑检索、截词检索等,个别数据库还开发出了古籍领域所要求的特色检索功能和特定的辅助用法,这些特殊的检索方式使得数据库的利用价值有了较大提高。
朝代检索:按朝代(当然更精确的是年代)检索的功能。朝代是在古文献学术研究上非常重要的一项数据,对于文献学者来说,对于朝代的界定关乎研究方向、研究背景和研究基调的确定,目前国内的中国基本古籍库和《国学宝典》的检索程序提供这一功能,《国学宝典》的朝代限定是分秦以前、两汉、魏晋南北朝、隋唐五代、宋辽金元、明、清、近代八段,而中国基本古籍库的朝代检索完全按照历史年代限定。最近的全功能试用版加入了和按年代检索(分)的检索的功能,
四部检索:按照古籍四部分类法进行检索。古籍的分类与现在知识分类方法不同,隋以前主要为七分法,《隋书·艺文志》以后四分法占据了主要地位。为了更好地符合古籍文献的特色,古籍数据库也采用了四部分类法,或者在此基础上按照四部分类的二级类目进行文献罗列。如《国学宝典》按范围检索分为经、史、子、集、其他五个部分,而中国基本古籍库则是以四部的二级类目为参考类目。
古籍源检索:按照古籍文本源所表现的形式信息检索。例如,中国社科院的《全唐诗》数据库检索系统,不仅可供快速查检《全唐诗》中任何作品的字、句、标题、注解,还可以查找该作品在《全唐诗》中的册、页、行数;而中国基本古籍库则提供版本检索内容,可以按照文献学界的普遍说法,输入宋刻本、明刻本等条目进行检索。
书法检索:按照文字的字形和书法家进行检索。目前提供书法检索的数据库主要是CADAL中的古籍数据库,其处理方法为:先根据特征从大量数据量中抽取可能相似的少量书法字,而后把用户提交的样本字与这些少量书法字进行不精确匹配,提高了检索速度和检准率。这种检索功能的扩展有助于书法艺术家及书法爱好者将同一汉字所有不同的历史书法字检索出来,排成一列进行对比,以研究书法艺术的发展演变过程。
内容扩展检索:当代古籍数据库在书目数据库与全文数据库检索功能的基础上,出现了综合检索系统。此类系统在检索性能上有了很大改进,检索
您可能关注的文档
最近下载
- 课件:第五章 自由主义社会福利思想(《现代社会福利思想》课程).pdf VIP
- 第二课 美的本质和特征课件 --中职技校《美育》第四版.pptx VIP
- 二 1~6的表内除法(单元教学设计)苏教版 二年级上册数学2025版.pdf
- 2025春新人教版九年级化学下册《第九单元 溶液》大单元整体教学设计[2022课标].docx
- 美育——美即生活-1.1美的起源和发展-教案.doc VIP
- 教科版科学五年级上册 第一单元《光》大单元教学设计.pdf VIP
- 2025年最新交通局辅警招聘考试题库(附答案).docx VIP
- 全国地图-县级.pptx VIP
- 《规划与自然资源语料库建设导则》.docx VIP
- 幕墙工程幕墙施工专项方案.pdf VIP
文档评论(0)