双音节离合词语料库语言学的研究.pdg.pdfVIP

  • 26
  • 0
  • 约3.75万字
  • 约 60页
  • 2016-05-10 发布于江苏
  • 举报

双音节离合词语料库语言学的研究.pdg.pdf

双音节离合词语料库语言学的研究.pdg.pdf

中文提要 离合词是现代汉语中的一种特殊的又较常见的语言现象。它在语法界一直是 一个热门话题;在对外汉语教学方面,相关研究也有一定的成果;但是在计算语 言学领域,离合词的自动处理一直是个难点,绝大多数分词标注系统目前尚无法 对其做自动标注,这给当前及以后的语料库造成不少的错误,更为今后的计算语 言学研究带来了较大的不便,因此,有必要对离合词的自动处理做专门的研究。 本文采用语料库语言学的方法,在2亿多字的真实文本范围内查找所有含有 离合词的句子并形成数据库,从中找寻排除错误句子、选取正确句子的方法,力 图能使自动搜索的正确率达到最高;并同时通过对数据库的考察和分析,总结出 了离合词的扩展规则并对扩展式中间字段中的规则词进行了自动标记,从而能利 于木领域更进一步的研究。 本文共分七章。第一章引言,介绍离合词标注的由来、本文研究的目的和意 义以及搜索用的文本:第二章是对离合词语法上的研究,语法研究是应用语言学 的基础,本文则主要选取了和语料库语言学研究方法密切相关的一些语法项如离 合词的界定、离合词的类型及扩展式等;第三章是本文的重点,详细介绍了离合 词搜索和标注的方法,本文所研究的方法主要有三种:直接搜索法、前后词删除 法和规则选择法,它们能较有效的在真实文本

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档