北京大学-研究生课程-“自然语言处理导论”课复习提纲.docVIP

  • 62
  • 0
  • 约小于1千字
  • 约 2页
  • 2017-08-17 发布于江西
  • 举报

北京大学-研究生课程-“自然语言处理导论”课复习提纲.doc

北京大学-研究生课程-“自然语言处理导论”课复习提纲.doc

“自然语言处理导论”课复习提纲 上半部分 (参考材料:课程讲义) 第1讲 绪论:什么是自然语言处理(NLP) 请举例说明自然语言和人工语言有哪些差异。 请举例说明语言知识与自然语言处理之间的关系。 第2讲 中文文本的自动分词 计算机对中文文本进行自动分词的困难主要有哪些? 请概括说明最大匹配法分词和最大概率法分词的基本思想。二者是什么关系? 分词质量的常用评价指标主要有哪些? 第3讲 词性标注方法 请举例说明汉语的基本句法结构类型有哪些,各类结构的主要特点是什么。 请举例说明汉语的主要词类有哪些,各类词的特点是什么。 请概述用隐马尔可夫(HMM)模型进行词性标注的基本思想是什么。 请概述韦特比算法(Viterbi)的主要过程。 请概述基于转换的错误驱动的词性标注方法的主要思想及其处理流程。 第4讲 汉语的句法结构分析(上) 什么是有限状态文法,上下文无关文法,两种文法的区别是什么。 自底向上的句法分析与自顶向下的句法分析的区别是什么。 Earley算法。 Tomita算法。Tomita算法对LR算法的主要改进是什么。 第5讲 汉语的句法结构分析(下) 请举例说明句法结构歧义有哪些不同的类型。 什么是特征结构?请举例说明如何运用特征结构表达自然语言知识。 什么是合一运算(Unification)?请举例说明如何运用合一运算表达自然语言知识。 请概述如何在Earley算法中融入合一运

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档