农业古籍断句标点的模式的研究.docVIP

  • 5
  • 0
  • 约6.55千字
  • 约 16页
  • 2018-10-13 发布于福建
  • 举报
农业古籍断句标点的模式的研究

农业古籍断句标点的模式的研究   摘要:农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。   关键词:计算机应用;中文信息处理;农业古籍;古农书;古籍整理;断句;标点;模式匹配   中图分类号:TP393 文献标识码:A      1 引言      中国农业已经有上万年的历史,有文字可考的历史已有5000年。在漫长的历史长河中涌现出了一大批农业著作,流传后世者亦不乏可观者。它们不仅记载和总结了我国古代农、林、牧、副、渔等方面的技术经验和生产知识,还包含了农业政策、农业经营管理、田制赋税、救荒赈灾等方面的重要资料,集中反映出我国传统农业的发展过程和历史特点,具有很高的科学和文化价值,是进行农业史、科技史以及经济史研究的重要文献依据。另一方面,我国农业古籍数量繁多,全部采用人工断句、标点费时费力,目前已经断句、标点的农业古籍只占很小一部分。而不加断

文档评论(0)

1亿VIP精品文档

相关文档