第五章中文信息处理的学科理论.ppt

第五章中文信息处理的学科理论

第五章 中文信息处理的学科理论 授课时间:2007年1月9日 授 课 人:徐艳华 信息处理的句法理论 信息处理的语义理论 中国计算语言学的理论影响 一、短语结构语法 语言知识的形式化表达手段主要有三种:形式语法、状态转移网络以及特征结构与合一运算。以这些表达手段为基础,对具体的一种自然语言(如汉语)的语言知识进行系统的整理,就得到了关于这种语言的形式语法理论体系。目前基于规则的自动句法分析的形式语法理论主要有短语结构语法、转换生成语法、管辖约束理论、广义的短语结构语法、功能合一语法、词汇功能语法、中心词驱动的短语结构语法、范畴语法、依存语法、树连接语法、链语法等。这些理论都是在计算语言学中经常使用的,它们是学习和研究时应该具备的计算语言学的基础知识。其中,短语结构语法是各种理论和方法的基础。 1、短语结构语法的形式化定义 短语结构语法PSG可以定义为一个四元组: G=T,N,S,P 其中,T是终结符号(terminal symbols)的集合,任何一部现代汉语词典中的词都可以成为这部语法中的终结符号。N是非终结符号的集合,包括词类标记(如名词N,动词V等等)和短语功能标记(如名词性短语NP,动词性短语VP等等)。S是N中的一个元素,称作起始符,语言中的每个句子都是从这个起始符开始推导。P代表一组式子组成的集合,P中的式子具有这样的形式:α→β。一般把

文档评论(0)

1亿VIP精品文档

相关文档