- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
工具书编纂平台辅助数据库应用
工具书编纂平台辅助数据库应用
首先从传统工具书的编纂流程入手,简要论述了工具书编纂现代化的意义。然后详细介绍了工具书编纂平台的三大组成部分:语料处理系统、编写与编辑审稿系统和复合出版系统。由此引出编纂平台中的辅助数据库部分。以编纂《唐宋文学词典》的资料准备为例,阐述了工具书编纂平台中辅助数据库的应用。
工具书编纂;编纂平台;辅助数据库;辞书现代化
1#8195;引言
工具书的编纂是一项旷日持久的艰巨工作。从确定编纂体例、收集语料到内容的编纂加工和编辑加工,再到印刷出版,整个过程需要花费大量的时间和精力,因此工具书的编纂历来就有“十年磨一剑”之说。计算机技术和互联网技术的迅猛发展以及中文平台的扩展,使数字化工具书编纂平台的建设成为了可能。目前国内多家出版社都在尝试建设工具书的数字化编纂平台,但具体的编纂模式、方法、手段皆处于探索之中。本文以作者所参加的上海市科委项目“汉语语词性工具书通用数字编纂平台”的实践,阐述辅助数据库在工具书编纂平台中的应用及重要作用。
2#8195;工具书编纂平台的三大组成部分
广义的工具书编纂平台,一般可分成三大部分:语料采集与语料处理系统、编写与编辑审稿系统和复合出版系统(见图1)。但综观各家出版社已经建成的编纂平台,大部分都很重视三大部分中的“编写与编辑审稿系统”中的编纂流程处理,却未能重视辅助数据库的作用。
2.1 语料采集与语料处理系统
这一部分是工具书编纂的基础工作,见图2。借助计算机技术,可以通过多种方式更加便捷地完成。首先,通过数据录入、电子文档数据转换、图像扫描OCR识别、网页抓取数据转换等方式进行最初的原始语料收集,建立起编纂所需的生语料库。然后根据工具书编纂的实际需要,在辅助数据库的帮助下对生语料库进行相应的加工,如切词处理、词频统计、词目比对、词性标注、标签截取等,从而进一步建立起编纂所需的熟语料库,为后续的编纂工作打下良好的基础。
2.2 编写与编辑审稿系统
这一部分主要包括两个方面,一是编写流程或编辑审稿流程在计算机上的实现,主要是将传统编纂流程转化到计算机上;第二方面即编纂平台的辅助数据库,见图3。
2.3复合出版
这一部分是工具书编纂平台的成果产出部分,见图4。以“一次制作,多元发布”为指导思想,根据用户的需求快速形成不同介质、不同手段的产品和服务,从而最大限度地实现出版资源的充分利用,减少重复投入,降低出版成本,满足不同的用户需求。
以上三大部分共同组成了工具书编纂平台。其中一、二部分涉及辅助数据库即本文所要论述的重点。
3#8195;编纂平台中的辅助数据库简介
3.1 辅助数据库的类别
从广义来说,凡是能对编纂工作起到帮助作用的,都可归入编纂平台的辅助数据库。广义的辅助数据库又可分为两类,一类是属于基本信息类的,如汉字基本信息库;另一类也就是狭义的辅助数据库,如汉语单字数据库、成套词数据库及依据相关规定建立的辅助数据库。
狭义的辅助数据库可以细分为三种:
一是与语义有关的,如单字关联库、单字释义库、复词关联库、复词释义库;
二是与类型有关的,如成套词、成语、典故、已进入语词范围的专科词表等;
三是与相关法规有关的,如现代汉语常用字表、现代汉语通用字表、港澳地区关于学生用字的字数和字形的相关规定、台湾地区关于学生用字字数和字形的相关规定等。
3.2辅助数据库的作用
工具书编纂平台的建设主要有两个目的:一是最大限度地减少编纂活动的工作量,最大限度地降低编纂工作的强度,缩短编纂和出版周期;二是利用计算机的运算能力,解决编纂过程中作者或编辑的水平高低造成的质量不平衡问题,最大限度地提高所编纂的工具书的质量。
这两个目的在工具书编纂平台中的体现,就是编纂平台的辅助数据库。
第一类与语义有关的辅助数据库,可以在作者编写、编辑审稿时提供释义的参考与相关语词的参考,方便编写和编辑加工,保证释义的质量。
第二类与类型有关的辅助数据库,可以在作者编写或立目时,提供同类成组的词,保证词目的平衡与释义的平衡,提高工具书的质量。
第三类与相关规定有关的辅助数据库,可以在作者确定编纂体例后,为作者提供精确的字表与词表,使作者节省大量的搜词立目的时间。
工具书编纂平台的实现,并不仅仅是简单地将平面的流程转移到计算机上进行,而是最大限度地提高出版生产力和提高出版质量。而建立相应的辅助数据库,就可以帮助缩短工具书的出版时间,提高工具书的质量。
在99版、09版《辞海》的编纂和稿件的审阅中,就已经利用数据库方便检索的特点,展开了一些成套词的检查。辞海编纂处副主任乐嘉民先生指出:“对于高素质
原创力文档


文档评论(0)