基于历史信息的中文多层次句法分析研究-计算机应用技术专业论文.docxVIP

  • 0
  • 0
  • 约6.31万字
  • 约 69页
  • 2019-03-30 发布于上海
  • 举报

基于历史信息的中文多层次句法分析研究-计算机应用技术专业论文.docx

基于历史信息的中文多层次句法分析研究 中文摘要 基于历史信息的中文多层次旬法分析研究 中文摘要 伴随着计算机综合能力的日益强大和互联网的迅猛发展,社会的信息化程度越来 越高,自然语言作为信息的重要载体,对它的计算机处理就显得格外重要。句法分析 是自然语言处理的一个基本问题。基于历史信息的句法分析模型将句法分析树的构建 转换为一系列的分类问题,由于其采用机器学习的方法,且与具体的语言和文法关联 较少,因此具有较强的灵活性和可扩展性。 本文基于统计的方法,提出了一种基于历史信息的中文多层次句法分析方法,在 正确分词的基础上,实现了一个包括词性标注、基本短语识别、深层句法分析的基于 词的句法分析系统。系统采用最大炮模型进行参数学习,在每层处理过程中,优先识 别出容易识别的组块,在此基础上根据更丰富的上下文信息循环进行复杂组块的识 别,直至识别出根结点。实验证明本系统取得了较好的性能。 本文还实现了基于词的句法分析树到基于字的句法分析树的转换,最终实现了一 种基于自动分词的句法分析系统,系统的分词准确率在 96%左右,在宾州中文树库测 试集 Section271-300 上,实验分析了系统的性能,并进一步分析了不同分词结果对句 法分析的影响。 关键词 z 自然语言处理,中文句法分析,历史信息,层次模型,最大娟模型 作者z 耿向好 导师z 朱巧明 英文摘要 基于历史信息的中文多层次句法分析研究 Research on Histozy-based Chinese Hierarchical Parsing Abstract Wi也 the increasingly power of computer capacity and the fast development of the Internet,the informativeness of the human society is becoming higher and higher. As an important carrier of information,computer processing of natural language is critical 扭曲e information society. 刀山 paper focuses on syntactic p缸sing,the fundamental problem in naturallanguage processing. ηús paper follows history-based approaches,such 部也e one in (Ratnaparkhi 1999), and explores a hierarchical p町sing s回tegy by constructing a p缸se tree level by Ievel, which inc1udes part-of-speech tagging,phrase chunki吨, and 耐uc阳ral parsing. 币le intuition behind our s位ategy 扭曲at simple constituents should be constructed frrst so 也at the complex ones can rely on richer contextual information in the following passes.ηús is done as follows: given a forest of trees (especially at beginning ,each word is regarded as a single tree),we recursively recognize simple constituents first and then form a new forest wi由a less number of trees until there is only one tree in the newly produced forest. In addition,也is paper also integrates Chinese word segmentation into the hierarcical parsíng strategy. Evaluation on the the Chinese Penn Treebank shows 也副 0町 hierarchical parsing strategy works well on 由e Chinese language and achieves compara

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档