- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言教学与研究 2008年第 2 期
名词隐喻的计算研究及识别实验
王 治 敏
提要 本文通过短语结构限定的方式 ,全面地考察汉语名词性隐喻的分布和构成特点 ,总
结和发现名词性隐喻的表达规律 , 同时在大规模语料考察的基础上 ,尝试规则约束和机器学习
方法 ,探讨了汉语名词性隐喻的理解和识别 。实验证明 ,机器学习方法在汉语名词隐喻识别中
取得了较为满意的效果 。
关键词 源域 ; 目标域 ;隐喻识别 ;最大熵
一 引言
( )
汉语中存在大量的隐喻表达 。L akoff 1980 指出隐喻的实质是通过一类事物来理解和经
历另一类事物 。作为人类的一种思维方式 ,隐喻无所不在 。国内隐喻的汉语计算理解研究刚
刚起步 ,可以借鉴的东西不多 。长期以来 ,在 自然语言处理领域 , 隐喻被认为是一种 “辞格 ”,
一直是中文信息应用系统不予考虑的问题 。不过 ,近几年随着语料库资源的不断发展 ,学者们
(
逐渐开始关注词语的情感色彩 、隐喻的理解问题 周昌乐 2004 ,张威 、周昌乐 2004 ,杨芸 、周昌
乐 2004 ,俞士汶 2005 ,戴帅湘 2005,王雪梅 2005, Zh im in W ang et al. 2006) 。
由于人们着眼点不同 ,对于隐喻的理解也各有不同。修辞学的分类 ,计算机很难把握 ,概
念隐喻的研究范围又有些宽泛 。因此本文对隐喻的界定首先采用短语结构限定的方式 ,只考
虑名词 n及与名词 n 相组合的短语结构中所包含的隐喻表达 , 即 “nn、n 的 n ”短语结构隐喻 ,
①
希望通过这样一种短语结构的全面考察 ,勾画出基于这种短语结构的名词隐喻表达的全貌 。
二 n + n 隐喻的数量分布
认识短语隐喻 ,首先从数量入手 ,通过 “n + n ”短语的整体考察 ,我们发现 “n + n ”隐喻表达
相对于全部的 “n + n ”短语来说数量并不是很多 ,但是针对具体词语的隐喻用例来看 , “n + n ”
短语隐喻却呈强势分布 。表 1是对 1998年 1月 - 4 月的 《人民日报 》的粗略统计 。
表 1显示了 95个源域词语在 4 个月 《人民日报 》语料的 n + n 隐喻分布情况 ,针对单个词
语的隐喻和非隐喻数量会有所差别 ,但是总体情况是基本相同的 ,就是隐喻表达所占比例略高
于非隐喻表达 。因此重视和发现单个词语的隐喻研究将是本文后续研究的一个突破方向。
( )
认知语言学则认为一个概念隐喻包含两个部分 ,一个始源域 sou rce dom ain 和一个 目标
( ) (
域 target dom ain , 隐喻的认知力量就在于将始源域的图示结构映射到 目标域之上 蓝纯
( ) ( )
本研究得到国家 973项 目 2004CB318102 和北京语言大学一般项 目 06YB06 的支持 。
68
2005: 116) 。这里的始源域也称作 “源域 ”,对应于汉语中的术语 “喻体 ”, “目标域 ”对应于汉
语中的 “本体 ”。为了能够更清楚地描述隐喻概念之间的映射关系 ,本文沿用了 “源域 ”和 “目
标域 ”的说法 。
表 1 1998年 1月 - 4 月 《人民日报 》的 “n + n ”隐喻分布
1998年 1 - 4 月语料 n + n 总数
文档评论(0)