第二篇-语言学基础.pdfVIP

  • 6
  • 0
  • 约1.45万字
  • 约 57页
  • 2017-06-07 发布于湖北
  • 举报
自然语言处理 Natural Language Processing 中央民族大学 孙媛孙媛 第二章第二章语言学基础语言学基础  最大的最大的语法单位法单位是句句子,比句句子小的的语法法 单位单位,依次是短语依次是短语、词词、语素语素。语素是最小语素是最小 的语法单位。  篇章篇章  段落  句子  短语短语  词  语素 一、语素语素 • 语素:语素是语言中音义结合的最小单位。 就就汉语来说来说,一个个汉字就字就是一个个语素素。 • 例如: 富富++裕裕→富裕富裕 乒乓乒乓++球球→乒乓球乒乓球 “富”、“裕”、“球”等每个单位都有 一定的读音和意义定的读音和意义,都是最小的语音和语都是最小的语音和语 义的结合体,它们分别为一个语素。“乒 乓乓”拆开以后拆开以后,都只能表示读音而不能表都只能表示读音而不能表 示明确的意义;因此,“乒乓”是一个语 素而不是两个语素素而不是两个语素。。 一、语素语素 • 根据语素在词中的不同作用把它分成词根、 词缀缀、词尾三类类。 • 词根是词的核心部分,词的意义主要由它 体现出来的体现出来的。它可以单独构成词它可以单独构成词,也可以也可以 彼此组合成词。汉语中绝大多数的词都是 由词根构成由词根构成。 一、语素语素 •• 词缀是只能粘附在词根上构成新词的语素词缀是只能粘附在词根上构成新词的语素, 它本身不能单独构成词。 • 粘附在词根前面的词缀称为前缀,粘附在 词根后面的词缀称为后缀词根后面的词缀称为后缀,,插入词根中间插入词根中间 的词缀称为中缀。 • 如如unknownunknown,enableenable,impossibleimpossible; reader,voiceless • 前缀、中缀、后缀都是粘附在词根之上的 附加成分附加成分,,称为前加成分称为前加成分、、中加成分和后中加成分和后 加成分。 一、语素语素 • 词尾:它加在词的末尾,只能改变一个词 的形式式,而不能构构成新新词。 • 如books,walking 二二、词与词性词与词性 • 词:词是最重要的一级语法单位。词是造 句句的时候候能够独立运用的最最小单单位。 • 独立运用,在造句中能够到处作为一个单 位出现位出现; • 最小:不能扩展,即中间不能插入别的成 分。 •• 比如比如,朋友朋友 二二、词与词性词与词性 • 从意义和作用上看,词可以分为实词和虚 词两大类词两大类。实词有实在的意义实词有实在的意义;;虚词是意虚词是意 义比较虚的词,能帮助造句,但不能单独 说说。。 • 词类是指词在语法上的分类,也就是把汉 语里的所有词语里的所有词,根据它们的词汇意义和语根据它们的词汇意义和语 法特点进行分类,这样得出的结果就是词 类或者叫词性(parts of speech) 二二、词与词性词与词性 • 主要包括名括名词(N)、动词(V )、形容容词 A )、数数词(M)、量词(Q )、副副词 ( (D)、代词(R)、介词(P)、连词 ((CC))、、助词助词 ((UU))、、叹词叹词 ((EE))、、拟声拟声 词(O)、习用语(I) 二二、词与词性词与词性 •• 名词名词 ((NN):):表示人或事物名称的词表示人或事物名称的词,,主主 要用来充任主语和宾语 • (1)(1)专有名词专有名词((np)):指称人和事物名称的名词指称人和事物名称的名词。 • (a) 人名(nph): 包括姓(复姓

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档