句处理中排歧问题补议(7页).doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
句处理中排歧问题补议(7页)

句处理中排歧问题补议( 陆俭明 王 黎 北京大学中文系 北京 100871 武汉大学留学生教育学院 武汉 430072 lujm@ wangli6502@ 摘 要:排歧问题是句处理中必须面对的一个重要问题,已有一些学者进行过研究与探索,提出了多种排歧策略。本文的目的是,通过对“N+A+的+不+V”这一句法格式所造成的不同句子的句法、语义分析,补充说明必须充分注意句中某个词语的具体意义在排歧中的重要作用。 关键词:中文信息处理 句子排歧 Structure And Meaning Disambiguation in Chinese Sentence Processing Lu Jianming Wang Li Dept. of Chinese ,Peking, University 100871 Institute of Education for International Students, Wuhan University 430072 E-mail: lujm@ E-mail: wangli6502@ Abstract: It is very important to parse ambiguous sentences in Chinese Information Processing by computer. As a case study, this paper analyses the structure and meaning ambiguity of sentence pattern N+A+De+Bu+V. In order to help computer to make correct decision on parsing of the sentence pattern, word sense should be paid more attention. Keywords: Chinese Information Processing, Sentence Structure Disambiguation 排歧问题是句处理中必须面对的一个重要问题,也是一个难题。以往已有一些学者进行过研究与探索,并已取得了不小的成绩。本文试通过一组具体例子的分析,对句处理中排歧所需考虑的问题,再作些补充,故谓“补议”。请先看实例: (1)香蕉青的不买。 (2)皮儿青的不买。 (3)皮儿青的不吃。 例(1)—(3),词类序列相同,都是“N+A+的+不+V”,但情况各不相同。我们先来考察一下它们的内部层次构造。例(1)只能作甲切分,不能作乙切分: (1)甲.香蕉 青的 不买 乙.香蕉 青的 不买 1 2 * 1 2 而例(2)则相反,只能作乙切分,不能作甲切分: (2)甲.皮儿 青的 不买 乙.皮儿 青的 不买 * 1 2 1 2 这为什么? 先分析例(1)。我们知道,形容词属于谓词,也有一个配价的问题。“青”是一个一价谓词。如果按乙切分,意味着“香蕉青的”是一个“的”字结构,它在句中作主语。可是,按照朱德熙先生的“VP的”这种“的”字结构的歧义指数公式进行计算,“香蕉青的”的歧义指数该是0,即:P = n — m = 1 — 1 = 0(P代表“VP的”的歧义指数,n代表谓词的配价数,m代表谓词的配价成分在“VP的”里所出现的数目)而“VP的”的歧义指数如果为0,那是不能作主语来指称事物的。由于“香蕉青的”的歧义指数是0,所以它不能再作主语来指称事物。因此例(1)只能作甲切分,不能作乙切分。按此切分,句子意思是香蕉有黄的,有青的,青的香蕉不买。类似的例子如: (5)梅子青的不摘。| 打印机旧的不要。| 点心太甜的不吃。| 杉树小的不砍。|…… 再分析例(2)。为什么例(2)不能作乙切分,得作甲切分?按照朱德熙先生的“VP的”这种“的”字结构的歧义指数公式进行计算,“皮儿青的”的歧义指数也应该是0,即:P = n — m = 1 — 1 = 0。按理说它也不能再作主语来指称事物。但是,我们发现,“VP的”这种“的”字结构的歧义指数公式有例外。例外有两种情况(以P=0的实例为例):一是可以指称V的某个已经在“的”字结构里出现的配加成分NP所指事物的领有者。例如: (6)孩子游泳的(游泳,一价,

文档评论(0)

heti94575 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档