基于XML的清人小学注疏五种词源研究 语料库的研制和应用.docVIP

  • 11
  • 0
  • 约4.84千字
  • 约 13页
  • 2017-09-07 发布于北京
  • 举报

基于XML的清人小学注疏五种词源研究 语料库的研制和应用.doc

基于XML的清人小学注疏五种词源研究 语料库的研制和应用   摘要:采用XML技术开展古籍专书的标注和研究,是计算机辅助语言研究的一个新领域。利用该标注技术建成的清人小学注疏五种词源研究语料库,对清代五部小学注疏词源研究成果的诸多方面有着准确的反映,为研究者查询利用相关词源研究成果提供了极大便利。该语料库的建设能为应用XML技术处理古籍文本,提取相关语言学知识提供借鉴。   关键词:XML词源学建模技术数字化一、引言   《广雅疏证》《说文解字注》《尔雅义疏》《方言笺疏》《释名疏证补》这五部清代小学注疏作品,不仅保存了历代探索字词源流丰富的诂训资料,而且能以“因声求义”之法疏解词义、补证理据、说解词源,堪称传统词源研究的一座宝库。现代先进的信息技术,为我们利用这些古籍开展现代词源学研究提供了有力支撑。   我们利用XML标注技术[1]建成了清人小学注疏五种词源研究语料库,该语料库对清代五部小学注疏词源研究成果的诸多方面有着准确的反映。通过检索该语料库,研究者可以及时而清楚地了解:1.各家对某组语词是否同源的判断;2.各家论证某组语词同源关系所征引的文献证据和语音证据;3.各家研究古今字、通假字、异体字的情况。下文将对该语料库的建设作详细介绍。   二、电子文本的生产   清人小学注疏五种的电子文本由吾师尉迟治平教授及门下弟子共同完成,笔者为主要参与者之一。   五种文

文档评论(0)

1亿VIP精品文档

相关文档