关于现代汉语词语的语法功能分类.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
俞士汶 关键词:语言信息处理、现代汉语、词类、语法功能 一.  信息处理用现代汉语词语分类体系 在朱德熙先生的语法理论的指导下 , 北大计算语言学研究所与中文系合作 , 经过几 年的研究 , 提出了一个服务于语言信息处理的现代汉语词语分类体系 , 并将五万多条的 词语实际进行了归类 , 与此同时还按类详细描述了每个词语的多种语法属性 , 初步建成 了“现代汉语语法信息词典” , 另外对数十万字的语料进行了切分和词性标注。这就又进 一步检验了词类划分的科学性与可操作性。 达到如此规模和如此深度的汉语语言工程实践可 能是罕见的。 本文介绍现代汉语词语分类体系、分类的理论基础 , 并以若干词类为例详细介绍具体 的划类准则。 现代汉语的词分为以下 18 个基本词类 , 括号中的拉丁字母是各类词的代码。 名词 (n), 时间词 (t), 处所词 (s), 方位词 (f), 数词 (m), 量词 (q), 区 别词 (b), 代词 (r), 动词 (v), 形容词 (a), 状态词 (z), 副词 (d), 介词 (p), 连词 (c), 助词 (u), 语气词 (y), 拟声词 (o), 叹词 (e) 。 这些基本词类可以合并为较大的词类。名词、时间词、处所词、方位词、数词、量 词统称为体词 , 动词、形容词、 状态词统称为谓词。 有一部分代词属于体词 , 另一部分代 词属于谓词。体词、谓词、区别词和副词又合称为实词。介词、连词、助词、语气词合称为 虚词。实词与虚词是汉语的两大词类。此外还有拟声词与叹词 , 它们游离于这两大词类之 外。 自然语言处理的常规技术要求在自然语言处理系统中配备一部电子词典。 对于计算机系 统来说 , 可以认为作为电子词典的登录项的语言单位是“词”。其中大部分肯定是语言学 家认同的词 , 这也就是暗示了其中还有一部分不能看作“词”。从计算机处理实际文本的 需要出发,从提高计算机处理效率的角度考虑,词典中另外包含了以下 7 类语言成分 : 前接成分 后接成分 语素字  (h): (k): (g):  阿 , 儿 , 民,  老 , 子 , 衣 ,  非 , 性 , 失 ,  超 , 员 , 遥 ,  单 器  郝 非语素字 成语 习用语 简称略语  (x): 鸳, 枇, 蚣 ( i): 按部就班 ( l): 总而言之 , ( j): 三好 , 全总  , 八拜之交 由此可见 前 4 类是比 “词” 更小的单位 , 不成词。 这些成分的数量是有限的 , 只要电子词典的 规模允许 , 应当尽可能地将这些成分全部收入。 后 3 类是比 “词” 更大的单位 , 词典中只能 收一部分使用频率高的。本文将电子词典中登录的各种语言成分笼统地叫做“词语”。 以下行文中的“词类”是就前面的 18 个基本词类而言的 , 有时也讨论上述后 类语言成分。  7 二.  词语分类的理论基础 分类的目的与依据 为了进行语法研究与信息处理 , 需要把语法功能相同的或者相近的词归成一类。 这里包含两项工作。一项是要针对汉语词语的全集 , 按照某种标准 , 建立一个分类体系。 第一章所介绍的就是面向信息处理的一种汉语词语分类体系。 另一项工作是决定该全集中的 每一个词语究竟属于哪一个词类 , 这项工作可以叫 “归类” , 不过人们习惯上也在 “归类” 的意义上使用“分类”这个术语。 如果面向人的语言研究 , 词语分类尚不十分迫切的话 , 那么面向计算机的语言研 究, 词语的语法分类及其代码化几乎是不可缺少的。词语分类实际上是将最重要的语法知识与语法规则条理化 , 从而为自然语言的分析与生成提供最重要的线索。 划分词类的本质根据只能是词的语法功能。所谓词的语法功能主要是指 : (1) 和某 个或某类词语组合的能力 ; (2) 在句法结构中充当句法成分的能力。 例如 , 考察具有如下语 法功能的词。 可以用作主谓结构中的谓语 , 但不能带真宾语。 如“个子高 , 教室安静”中的“高 , 安 静”是谓语。象“高三公分 , 安静了两天” 中的数量短语 “三公分 , 两天”是 准宾语 , 而不是真宾语。 可以受“很”一类程度副词修饰, 如“很高 , 挺安静 , 特别雄伟”。 可以作述补结构中的补语 , 如“洗干净 , 捆得结实”中的“干净、结实”是补语。 直接或加“地”后作状中结构中的状语 , 如“迅速提高 , 安全地转移”中的“迅速、安全”是状语。 直接或加“的”后作定中结构中的定语 , 如“漂亮小姐 , 挺拔的山峰”中的“漂亮、挺拔”是定语。 f. 可以用 a + “不” + a 的形式提问 , 如“硬不硬 , 痛苦不痛苦”。 后可接语气词“着呢” , 如“美着呢 , 痛快着呢”。 : : 可将这

文档评论(0)

135****9629 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档