- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关联词离析度在有标复句层次自动分析中的应用.pdf
2011 年 7 月
第 43 卷第 4 期
云南师范大学学报
(哲学社会科学版)
}u1. ? 2011
Vo1. 43 No.4
关联词离析度在有标复旬层次自动分析中的应用费
.币在-
汪梦翔
〈华中师范大学文学院,湖北武汉 430079)
[摘 要] 汉语有标复句层次关系的自动分析一直是中文信息处理的热点和难点.本文在前人基
础之上,引人关联词的离析度这一概念,从一种新的视角来对原先一些复句层次自动划分的方法进行一
种补充和完善,从而为人们更好的实现复句层次的自动识别打下基础.
[关键词] 有标复句;关联词 F离析度
[中图分类号J H043 [文献标识码J A [文章编号J 1000--5110(2011)04一0148--05
导言
一提到复句研究,都不可避免地要涉及关联
词。因为复句层次的划分,很多时候跟关联词有
很大关系。尤其是对于中文信息处理来说,要想
让计算机很准确地分析出复句的层次,那么关联
词是一个重要的划分依据。而制约计算机自动划
分复句层次的一个很重要的因素,就是关联词间
的套用和省略机制。也就是说,关联词在使用过
程中往往不是规则的成对使用,而是经常租别的
关联词一起连用、套用,甚至是省略着使用。
例如 z
1) 因为中国女人个头矮,如果再把那大披肩
裹上肩,人就快没有了. (长江日报))1994-1-
25)
2)如果因为失恋就放弃宏伟的理想,浸没艺
术的才华,泯天青春的火焰,那就贬低了生命的真
正价值。(长江日报1985-4一22)
1)句中,表结果的所以出现了省略,而且因果关
系因为…. (所以产套用进了假设关系如果
就
2)句中,出现了假设关联词和因果关联词的连用,
而且假设关系关联词如果……就……套用进了
因果关系关联词因为......(所以户,当然这个表
结论的所以也省略了。
如何能让计算机在关联词间套用或省略使用
中准确的划分好复句的层次,一直都是大家关心-
而且也感到比较棘手的问题。比如(1)句中,因
为是管到个头矮还是裹上肩,这对于计算机
来说有一定的难度。
-、美联词离析度概念的引入及相关特征
为了更好地解决以上这一问题,我们引人了
复句离析度这一概念。其实对于关联词离析度这
一概念的提出和考察,前人已经做过。较为系统
性论证的是刘云,具体可以参见他 2008 年的《复
句关联词语离析度考察》一文。[1]刘云不仅提出了
关联词离析度这一概念,而且还系统地考察了一
些关联词的离析度,并取得了一些成效。刘云认
为复句关联词语的离析度是指固定搭配成对的
复句关联词语离析的能力,[I]而关联词间的这一
离析能力是有差异的。例如 2
3) 因为对他不了解,我们对他的期望值一直
很高,刚开始他使出浑身解数为我们上口语和写
作课,我们也十分合作,可渐渐发现他其实对英语
语言与文学的教学可谓七窍通了六窍,所以不
满情绪日益高涨。(长江日报1997一 12一29)
的与其在梦境中追求,不如在现实中寻找。
长江日报1991-12一29)
例 3)句的因为......所以说离析能力要大于的
句中与其......不如的能力。一般来说因为
……所以......间很容易套用进其他关联词,而且
经常省略部件,但是对于与其......不如......来
说,它们之间就很难再嵌套进其他关联词,而且相
铸[收稿日期J2010一 10一08
[基金项目]本文系霍英东基金支持项目汉语复句的自动分析及其应用的成果之一,(项目编号 :111097).
[作者简介]汪梦翔1984一) ,男,湖北大冶人,华中师范大学助教,研究方向为现代汉语语法.
第 4 期 汪梦翔 z 关联词离析度在有标复句层次自动分析中的应用 149 ?
隔的距离也不会很远,且很少出现省略前件或后
件的现象。因此,我们可以说关联词因为......所
以……的离析度要强于关联词与其……不如
......。当然不是说两个关联词相隔得越远就说
明这两个关联词的离析度就大的,离析能力不等
同于离散能力,它是有一定的衡量标准的.
那么衡量关联词离析度的标准和考察的尺度
有哪些呢?为此刘云从省略能力、扩展能力、嵌
套能力、停顿能力、管控能力、对应能力、换位能
力来判断关联词间离析度的强弱,并以常数赋值
的方式对一些常用关联词进行了标值记录,大体
上得出了一些常用关联词的离析能力强弱梯度排
序,这一点对中文信息处理是非常有帮助的.
另外通过考察关联词间的离析度,刘云得出 z
一般情况下,单音节的关联词要比双音节的关联
词离析度普遍要低。口]我们发现,对于一对完整的
关联词,前件和后件都是双音节的前件或后件
有一个单音节的〉前后件都是单音节的.比如
既......又的关联词要比不但……而且的离析
度要低。既……又一般中间很难插进去较快的
句法成分,而且一般都是以词
文档评论(0)