文化行业标准《汉语文古籍文字认同描述规范》编制说明.PDFVIP

文化行业标准《汉语文古籍文字认同描述规范》编制说明.PDF

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文化行业标准《汉语文古籍文字认同描述规范》编制说明.PDF

文化行业标准《汉语文古籍文字认同描述规范》 编制说明 (一)工作简况,包括任务来源、协作单位、主要工作过程、文化行业标准 主要起草人及其所做的工作等; 1.任务来源 根据原文化部文化科技司批复,《汉语文古籍文字认同描述规范》正式立项 为 2016 年文化行业标准制定计划项目,项目牵头承担单位为国家图书馆,由全 国图书馆标准化技术委员会归口管理,项目编号:WH2016-01。 2.标准起草单位和起草人 本标准牵头起草单位为国家图书馆,参与起草单位为天津图书馆和汉王科技 股份有限公司。 陈红彦作为整个标准的起草召集人,起草组成员包括王昭、谢冬荣、萨仁高 娃、李国庆、潘慧敏、肖禹、张毅、白帆、杜立功、赵依澍、江世盛、孟晓静、 王战波等。在本标准起草过程中咨询了有关单位意见,参考了相关项目的成果, 并进行了相关的论证与补充工作。 3.主要工作过程 本项目的主要目标是依据汉语文古籍文献中文字的特性,结合全文检索、数 据挖掘、知识发现、文本显示与输出等应用需求,通过文献调查和实例分析建立 文字认同描述数据模型,形成汉语文古籍文字认同描述规范。本标准的起草工作 主要分为四个阶段。 第一阶段:文献研究(2016 年9 月—2016 年10 月) 收集整理国家语委与古籍文字认同相关的标准规范,研究数字方志、中华寻 根网、(台湾)异体字字典等已有成果和应用实例,对现有成果进行深入分析和 比较研究,在此基础上归纳古籍文献中的文字特性,并构建文字认同描述数据模 型,包括文字认同描述元数据、文字认同规则描述数据 (包括文字认同规则数据 和文字认同规则适用范围描述数据)和文字认同过程描述数据三部分。 第二阶段:修订标准框架与专家论证(2016 年11 月—2016 年12 月) 在已有研究成果的基础上,研制标准规范草案,采用多种方式进行专家咨询, 如:2016 年11 月17 日举行讨论会,邀请李孝聪、黄燕生、赵嘉朱、马文大等专 家参会。会上专家对标准草案进行逐条讨论,就术语定义、应用范围、共性与个 案处理等问题提出建议;2016 年12 月16 日再次举行论证会,邀请罗琳、张英聘、 谭烈飞、成一农等专家参会,会议就修改后的标准草案进行了详细的论证。专家 认为此规范在修改后有很大改进,同时就部分细节内容和文字表述提出了建议。 第三阶段:完善标准规范草案与实证研究(2017 年1 月— 2018 年5 月) 根据专家意见和建议,进一步完善标准草案,结合国家图书馆中华寻根网项 目进行标准规范验证,并进行必要的修订。目前已经完成汉语文古籍文字认同描 述规范草案。 第四阶段:形成标准规范征求意见稿 (2018 年6 月) 依据 《标准化工作导则第 1 部分:标准的结构和编写》(GB/T 1.1-2009) 完成标准规范文档,提交全国图书馆标准化技术委员会秘书处,根据秘书处形式 审查意见进行完善,并配合秘书处初审意见反馈,修改完善标准形成标准征求意 见稿,并向业界公开征求意见。 (二)文化行业标准编制原则和确定文化行业标准主要内容(如技术指标、 参数、公式、性能要求、试验方法、检验规则等)的论据(包括试验、统计数据), 修订文化行业标准时,应增列新旧文化行业标准水平的对比; 1.编制原则及论据 经过近三十年的发展,古籍数字化研究与实践取得了丰硕的成果,产生了一 大批有影响的古籍数字化项目。这些古籍数字化项目具有检索和浏览等功能,但 在文字处理方面还有所欠缺。古籍中大量存在的避讳字、异体字、草体字(手抄 本中的)等,增加了古籍文本转换的难度,降低了全文检索的效率。古籍数字化 过程中的文字处理是一个非常复杂的问题,既是学术问题,涉及文字学、文献学 等人文学科,又是技术问题,需要中文信息处理、软件工程等技术的支持。 在古籍数字化过程中,文字认同是文字处理方法之一,其规范化和标准化程 度直接影响古籍数字资源系统的研发与使用,制约数据挖掘、知识发现等技术的 应用与产业化。目前,因缺少相关的标准规范,古籍数字化厂商或数据库供应商 的文字认同处理方式较为简单,且没有完整的处理过程数据和描述,这就造成了 标准不统一、无法共享、难于整合。只有建立古籍文字认同描述行业规范,才能 降低古籍数字化中文字处理的技术难度和数据加工成本,同时降低古籍文本数据 应用和整合的成本,为学术研究

文档评论(0)

zcbsj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档