胡明扬主编词类问题考察续集.pdfVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
信息处理用现代汉语词类体系 胡 明 扬 理论原则和具体要求 信息处理用 的现代汉语词类 的分类标准应该和母语教学用 的现 代汉语词类 的分类标准保持一致 ,唯一 的分类标准 只能是句法功 能。因为计算机处理 自然语言只能根据词类序列,连 同词类属性提 供 的信 息 ,来判 定句法结构 ,所 以划分词类 的标准 只能是句法功 能。句法功能主要是指句子成分功能,但是也包括在短语 中的组合 功 能 。在划分词类 时 ,句子成分功 能具有普遍性 ,但 不具有排他 性 ;短语组合功能,或所谓鉴定词和鉴定格式具有排他性,但不具 有普遍性 。这一点经过近年来 的研 究各家意见 已经渐渐趋于一致 , 尽管在具体操作过程 中还有不同意见。 信息处理用 的现代汉语词类体系的分类肯定要 比母语教学用 的 现代汉语词类体系的分类分得更细 。因为掌握母语 的人会 自动补充 很多必要 的句法信息,而计算机却无法 自动补充任何必要 的语法信 息,因此 ,分类分得细一些,实际上就是给计算机提供更多的句法 信息,便于计算机 自动进行句法分析。 信息处理用 的现代汉语词类体系,不仅应该考虑尽可能满足计 算机 自动进行句法分析 的需要 ,也应该考虑句法分析 以后作 出相应 的语义解释 的需要 ,此外,还应该尽可能为计算机辨认词库 中没有 的新词语创造条件 。按理,信息处理用 的现代汉语词类体系还应该 考虑生成现代汉语语句 的需要 ,但是鉴于 目前 的条件 ,本项 目暂不 考虑生成 的需要 。 词语 的句法功能 自有相应 的语义基础 ,但是语义的判定有极大 的主观随意性 ,因而无法作为分类 的标准 ,而且 由于 同样 的理 由, 也无法作为判定词语 的同一性的标准 ,更何况计算机根本无法像人 那样 自动辨认语义,所 以当词语 出现多功能现象时,分类 的标准仍 然只能是句法功能;任何偏离句法功能标准 的做法势必破坏聚合关 系和组合关系之间的有机联系,从而使词类和句法脱钩 ,最终使词 类本身失去存在 的意义。 信息处理用 的现代汉语词类体系在某些具体 问题 的处理上可 以 和母语教学用 的现代汉语词类体系有所不 同,例如 ,固定短语 (成 语 、俗语 、谚语等 )等都可 以作为语项 ( )存入词库, 如“像 /和 /跟 样 /一般 ” “如 /如果 /假如……的话 ”,甚至 “……分之……”等等都可 以作为特殊 的 “词语 ”放在词库里 。这 些特殊成分一旦放在词库里,按理,也应该给 出 “词性 ”。这样做 可能并不十分 困难 ,例如,固定短语一般是一句句子 ,或者是名词 性 的、形容词性 的、动词性 的等等 ,可 以分别标注相应 的词性 , “像 样 ”等等可 以注介词性的, “如果……的话”可 以注连词 性的, “……分之……”也许可 以认为是数词性的。最后 ,一些近 乎词缀的成分 ,如 “非~,反~ ,超~”等等 , “~性,~化 ,~ 度 ”等等可 以作为特殊的 “词类”来处理。 再分类讨论 名词 名词可 以考虑把 时间名词 、处所名词 、方位名词这三个 附类分 出去。这三类分出去 以后沿用原名,还是称作 “时间词” “处所词” “方位词”都可 以,反正到了计算机里面都是代码。 这里 “时间词 ”没有什么 问题 , “处所词 ”和 “方位词 ”都有 些小 问题 。表示处所 的 “处所名词 ”和 “时间名词 ”不一样 ,不能 直接用作状语 ,用作状语时必须在前面加介词 ,和 /或后面加方位 名词 。这和一般名词没有什么不 同,但是 出现在主题位置上介词在 一般情况下不 出现 ,表示处所 的专有名词后面和用作补语 的 “介词 +处所名词 ”后面不 出现方位 名词 。这就和一般名词不太一样 。不 过 ,表示处所 的名词 ,不加介词 ,又不跟方位 名词 ,是不能用作状 语 的 ,所 以从 总 的来看 ,和一般名词没有太大差别 ,似乎可 以不予 考虑 。有一类表示处所 的 “不 能单用 的单音节 ‘字 ’+单音节方位 名词 ”的单位应该说是 “词 ”,如 “国内” “国外 ” (甚至还有 “国 内外 ”) “校 内 (外)”等

文档评论(0)

konglingdi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档