论述规则和统计相结合的句法分析一致性检验.docVIP

  • 2
  • 0
  • 约3.76千字
  • 约 9页
  • 2017-02-21 发布于河北
  • 举报

论述规则和统计相结合的句法分析一致性检验.doc

论述规则和统计相结合的句法分析一致性检验

论述规则和统计相结合的句法分析一致性检验   句法分析就是对词语的语法功能和句子的结构进行分析。句法分析的研究方向通常是依据一个大规模的句法分析树库,通过分析研究,建立统计模型。如果句法树库的准确率不高,将会降低句法树库模型的学习效果,进而影响自动标注句法分析结果的质量。目前出现的汉语句法分析自动标注的模型较多,但是完全句法分析自动标注的准确率不是太理想,为了构建高质量的大规模树库,需要投入大量的人工和时间。通过遍历完全句法分析树库发现,人工标注结果存在的不一致现象非常普遍。为了提高句法树库质量,本文采用的方法是通过分析标注错误的现象,编写规则和建立统计模型,自动查找标注错误的地方,对于单个标注错误的地方自动修正。   国外许多研究者在建立句法分析模型方面做出了很多探索。斯坦福大学的Roger Levy等人提出了分析汉语语料的困难,他们通过分析汉语语料库发现,一些类型的标注错误是由于汉语语法内在的歧义引起的。有些错误是标注经验导致的。通过最大似然估计PCFG特征模型,能够提高句法分析的准确率。针对汉语树库完全句法分析一致性检验的研究,目前国内不是太多,较多的是关于句法分析自动标注的解决方法。詹卫东等人分析句法格式,总结了很多句法结构歧义类型,分析特征,并通过检查树库统计了典型类型的数量。魏莉等人分析完全句法分析语料库,探索分词标注、词性标注和句法结构标注三个方面的错

文档评论(0)

1亿VIP精品文档

相关文档