《基于特征自动选择方法的汉语隐喻计算》.docVIP

  • 7
  • 0
  • 约 13页
  • 2016-06-21 发布于河南
  • 举报

《基于特征自动选择方法的汉语隐喻计算》.doc

《基于特征自动选择方法的汉语隐喻计算》.doc

基于特征自动选择方法的汉语隐喻计算 曾华琳,周昌乐*,陈毅东,史晓东 (厦门大学信息科学与技术学院,福建省仿脑智能系统重点实验室,福建 厦门 361005) 摘要:汉语隐喻计算是中文信息处理中的棘手难题之一。已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强,难以扩充的缺点,并且对于专业背景知识要求比较严格。本文基于大规模语料库的机器学习,利用最大熵分类模型,提出了一种最优特征模板自动抽取的隐喻识别算法,讨论了三种不同层次的特征模板,既包含了经典的简单特征,又将跨多个词的远距离上下文信息,以及描述语义信息的词语相似性引入特征模板进行考察。实验结果证明,该算法提高了隐喻识别准确率,是一种对于隐喻计算行之有效的机器学习方法。 关键词:汉语隐喻计算;隐喻识别;机器学习;自动特征选择 中图分类号:TP 391.1 文献标识码:A 隐喻,广泛的存在于语言。从亚里士多德修辞学,到的认知学中文,抑或是西方语言学研究,处于前沿探索阶段的1-7]。与计算机科学的-中文信息处理则属于语义级别的范畴,至今仍然的难题之一 汉语隐喻的研究,主要集中在两大方面:隐喻识别和隐喻理解,统称为隐喻计算,计算和逻辑的方法占据了主流地位8-15],无论是纯规则,或者是规则和统计相结合,和-based)的通病,也是阻碍隐喻计算实用化的所在,机器学习方法,21]运用到计算

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档