工具书编纂平台辅助数据库应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
工具书编纂平台辅助数据库应用

工具书编纂平台辅助数据库应用   首先从传统工具书的编纂流程入手,简要论述了工具书编纂现代化的意义。然后详细介绍了工具书编纂平台的三大组成部分:语料处理系统、编写与编辑审稿系统和复合出版系统。由此引出编纂平台中的辅助数据库部分。以编纂《唐宋文学词典》的资料准备为例,阐述了工具书编纂平台中辅助数据库的应用。   工具书编纂;编纂平台;辅助数据库;辞书现代化      1#8195;引言      工具书的编纂是一项旷日持久的艰巨工作。从确定编纂体例、收集语料到内容的编纂加工和编辑加工,再到印刷出版,整个过程需要花费大量的时间和精力,因此工具书的编纂历来就有“十年磨一剑”之说。计算机技术和互联网技术的迅猛发展以及中文平台的扩展,使数字化工具书编纂平台的建设成为了可能。目前国内多家出版社都在尝试建设工具书的数字化编纂平台,但具体的编纂模式、方法、手段皆处于探索之中。本文以作者所参加的上海市科委项目“汉语语词性工具书通用数字编纂平台”的实践,阐述辅助数据库在工具书编纂平台中的应用及重要作用。      2#8195;工具书编纂平台的三大组成部分      广义的工具书编纂平台,一般可分成三大部分:语料采集与语料处理系统、编写与编辑审稿系统和复合出版系统(见图1)。但综观各家出版社已经建成的编纂平台,大部分都很重视三大部分中的“编写与编辑审稿系统”中的编纂流程处理,却未能重视辅助数据库的作用。   2.1 语料采集与语料处理系统   这一部分是工具书编纂的基础工作,见图2。借助计算机技术,可以通过多种方式更加便捷地完成。首先,通过数据录入、电子文档数据转换、图像扫描OCR识别、网页抓取数据转换等方式进行最初的原始语料收集,建立起编纂所需的生语料库。然后根据工具书编纂的实际需要,在辅助数据库的帮助下对生语料库进行相应的加工,如切词处理、词频统计、词目比对、词性标注、标签截取等,从而进一步建立起编纂所需的熟语料库,为后续的编纂工作打下良好的基础。    2.2 编写与编辑审稿系统   这一部分主要包括两个方面,一是编写流程或编辑审稿流程在计算机上的实现,主要是将传统编纂流程转化到计算机上;第二方面即编纂平台的辅助数据库,见图3。   2.3复合出版   这一部分是工具书编纂平台的成果产出部分,见图4。以“一次制作,多元发布”为指导思想,根据用户的需求快速形成不同介质、不同手段的产品和服务,从而最大限度地实现出版资源的充分利用,减少重复投入,降低出版成本,满足不同的用户需求。   以上三大部分共同组成了工具书编纂平台。其中一、二部分涉及辅助数据库即本文所要论述的重点。      3#8195;编纂平台中的辅助数据库简介      3.1 辅助数据库的类别   从广义来说,凡是能对编纂工作起到帮助作用的,都可归入编纂平台的辅助数据库。广义的辅助数据库又可分为两类,一类是属于基本信息类的,如汉字基本信息库;另一类也就是狭义的辅助数据库,如汉语单字数据库、成套词数据库及依据相关规定建立的辅助数据库。   狭义的辅助数据库可以细分为三种:   一是与语义有关的,如单字关联库、单字释义库、复词关联库、复词释义库;   二是与类型有关的,如成套词、成语、典故、已进入语词范围的专科词表等;   三是与相关法规有关的,如现代汉语常用字表、现代汉语通用字表、港澳地区关于学生用字的字数和字形的相关规定、台湾地区关于学生用字字数和字形的相关规定等。   3.2辅助数据库的作用   工具书编纂平台的建设主要有两个目的:一是最大限度地减少编纂活动的工作量,最大限度地降低编纂工作的强度,缩短编纂和出版周期;二是利用计算机的运算能力,解决编纂过程中作者或编辑的水平高低造成的质量不平衡问题,最大限度地提高所编纂的工具书的质量。   这两个目的在工具书编纂平台中的体现,就是编纂平台的辅助数据库。   第一类与语义有关的辅助数据库,可以在作者编写、编辑审稿时提供释义的参考与相关语词的参考,方便编写和编辑加工,保证释义的质量。   第二类与类型有关的辅助数据库,可以在作者编写或立目时,提供同类成组的词,保证词目的平衡与释义的平衡,提高工具书的质量。   第三类与相关规定有关的辅助数据库,可以在作者确定编纂体例后,为作者提供精确的字表与词表,使作者节省大量的搜词立目的时间。   工具书编纂平台的实现,并不仅仅是简单地将平面的流程转移到计算机上进行,而是最大限度地提高出版生产力和提高出版质量。而建立相应的辅助数据库,就可以帮助缩短工具书的出版时间,提高工具书的质量。   在99版、09版《辞海》的编纂和稿件的审阅中,就已经利用数据库方便检索的特点,展开了一些成套词的检查。辞海编纂处副主任乐嘉民先生指出:“对于高素质

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档