《基于特征自动选择方法的汉语隐喻计算》.docVIP

下载本文档

7
0
约 13页
2016-06-21 发布于河南
举报

《基于特征自动选择方法的汉语隐喻计算》.doc

基于特征自动选择方法的汉语隐喻计算曾华琳，周昌乐*，陈毅东，史晓东（厦门大学信息科学与技术学院，福建省仿脑智能系统重点实验室，福建厦门 361005）摘要：汉语隐喻计算是中文信息处理中的棘手难题之一。已有的隐喻识别研究多以人工方式分析和抽取隐喻特征，存在着主观性强，难以扩充的缺点，并且对于专业背景知识要求比较严格。本文基于大规模语料库的机器学习，利用最大熵分类模型，提出了一种最优特征模板自动抽取的隐喻识别算法，讨论了三种不同层次的特征模板，既包含了经典的简单特征，又将跨多个词的远距离上下文信息，以及描述语义信息的词语相似性引入特征模板进行考察。实验结果证明，该算法提高了隐喻识别准确率，是一种对于隐喻计算行之有效的机器学习方法。关键词：汉语隐喻计算；隐喻识别；机器学习；自动特征选择中图分类号：TP 391.1 文献标识码：A 隐喻，广泛的存在于语言。从亚里士多德修辞学，到的认知学中文，抑或是西方语言学研究，处于前沿探索阶段的1-7]。与计算机科学的-中文信息处理则属于语义级别的范畴，至今仍然的难题之一汉语隐喻的研究，主要集中在两大方面：隐喻识别和隐喻理解，统称为隐喻计算，计算和逻辑的方法占据了主流地位8-15]，无论是纯规则，或者是规则和统计相结合，和-based）的通病，也是阻碍隐喻计算实用化的所在，机器学习方法,21]运用到计算

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

《基于特征自动选择方法的汉语隐喻计算》.docVIP