确定切词单位的某些语法因素-中国语言文字网.docVIP

  • 2
  • 0
  • 约2.06万字
  • 约 20页
  • 2017-10-28 发布于天津
  • 举报

确定切词单位的某些语法因素-中国语言文字网.doc

确定切词单位的某些语法因素-中国语言文字网

Journal of Chinese Language and Computing GB .sg/cgi-win/journal/paper.exe 中国语料库研究的历史与现状 冯志伟 教育部语言文字应用研究所 朝内南小街 51 号 100010 北京,中国 e-mail: zwfengde@ 2001年11月25日提交,2002年7月25日修改 摘要 本文首先简要回顾了国外语料库的概况,然后,比较详细地介绍中国语料库的发展情况,包括早期的语料库、国家级语料库、大规模真实文本语料库、口语语料库、双语语料库、少数民族语言语料库等,接着介绍语料库的各种加工技术,如自动切分、自动词类标注、自动短语结构标注、自动双语对齐等,使我们对于语料库研究得到一个鸟瞰式的认识。最后讨论了当前语料库研究中的一些问题,如语料库的规范和标准问题,语言资源共享问题、知识产权问题等。 关键词 语料库;大规模真实文本;口语语料库;双语语料库;少数民族语言语料库;自动切分;自动词类标注;自动短语结构标注;双语对齐 语言学的研究必须以语言事实作为根据,必须详尽地、大量地占有材料,才有可能在理论上得出比较可靠的结论。传统的语言材料的搜集、整理和加工完全是靠手工进行的,这是一种枯燥

文档评论(0)

1亿VIP精品文档

相关文档