基于机器学习算法的隐喻识别研究-计算机科学与技术;计算机应用技术专业论文.docxVIP

基于机器学习算法的隐喻识别研究-计算机科学与技术;计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘 摘要 摘 要 隐喻是自然语言处理领域最棘手的问题之一,这个问题逐渐引起了学者们 的关注,并且隐喻在思维及语言中所处的中心地位也逐渐为自然语言处理研究 者所认同。隐喻是通过一个事物来表达另外一个事物,它不仅是~种修辞手段, 而且体现着人的一种类比认知和思维方式。实际上,隐喻现象是一切自然语言 中普遍存在的现象,是自然语言处理不可回避的问题,因此隐喻问题若得不到 很好的解决,将成为制约自然语言处理和机器翻译发展的瓶颈。 近几年来,在隐喻识别方面,机器学习方法和大规模知识获取成了新的亮 点。本文选择汉语文本中的隐喻计算问题作为研究对象,以隐喻识别为研究内 容,从名词性隐喻和动词性隐喻这两种最主要的隐喻类型入手,采用多种机器 学习算法,广泛地探讨了隐喻的识别方法。 本文选择了20个常用的隐喻词语,使用2001年-2004年的《人民日报》语 料进行隐喻识别研究,主要研究内容如下: 基于有监督学习的隐喻识别。针对名词性隐喻和动词性隐喻这两类主要的 隐喻类型,提出了基于RFR SUM模型、SVM算法、CRF模型、最大熵模型和语 义相似度计算模型的隐喻识别方法。分类方法为识别隐喻提供了一个机器识别 的思路,考察了主流的分类方法在识别隐喻时的性能和效果。其中,RFR SUM 模型识别性能比较稳定,名词性和动词性隐喻的正确率的稳定性保持地最好。 另外,CRF模型的识别正确率比SVM算法的略高,但是效果最好的是语义相似 度计算模型。这个模型在采用K近邻分类算法的基础上,融入了语义相似度计算, 使它的隐喻识别性能得到提高,是五个模型中隐喻识别正确率最高的。此外, 对五个模型的实验结果进行了基于投票的集成实验。使隐喻识别正确率得到提 升,名词性隐喻正确率达N87.74%,动词性隐喻正确率达N85.27%。 基于聚类算法的隐喻识别。在聚类过程中,样本间的相似度使用了基于同 义词词林的向量空间相似度计算和基于知网的语义相似度计算两种方法,采用 K.means算法原理,并对K-means算法的随机选择初始聚类中心的方法进行了优 化。聚类实验设计了三个方案来提升隐喻识别结果的正确率,其中方案二不仅 利用了近距离搭配信息,也考虑了远距离的特征信息,使实验结果得到提高。 基于半监督算法的隐喻识别。探讨了利用K.means算法和RFR SUM模型对 隐喻识别进行半监督学习的方法,该算法是在分类实验和聚类实验的基础之上 实现的。不仅利用了已标记样本的信息量,而且运用了未标记样本提供的信息, 提高了隐喻识别的正确率。 摘要最后,构建了用于隐喻计算的小型隐喻知识库。在隐喻研究的实验结果基 摘要 最后,构建了用于隐喻计算的小型隐喻知识库。在隐喻研究的实验结果基 础上,利用算法抽取隐喻类的特征词,并把特征词依据对应的RFR值进行排序, 建立基于隐喻特征—-RFR值这种结构的隐喻知识库。此外,通过基于知识库的 隐喻计算实验,验证了构建的隐喻知识库的有效性。 总之,本文的研究工作主要是基于机器学习算法和知识获取方法,探讨了 各种机器学习算法进行隐喻识别的实验思路,避免了手工知识库和规则方法的 不足,积累了多种机器学习算法进行隐喻识别的大量实验数据,获得了隐喻识 别研究较理想的实验结果。本文研究方法可以为隐喻计算、隐喻理解、隐喻本 体研究及自然语言处理相关研究提供支持。 关键词:隐喻识别,机器学习,分类算法,聚类算法,半监督学习,知识获取 Il AbstractAbstract Abstract Abstract As one of the intractable problems in field of NLP(Natural Language Processing),metaphor has attracted more attention from researchers in recent years. And researchers have realized that it is the focus of mind and language mechanism. Metaphor is to express one thing in terms of another based on some similarities between the two things.It is not only a rhetorical devices of language,but also embodies people’S analogical cognitive and way of thinking.In fact,the metaphor is prevalent phenomenon in all of the natural language.Also the

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档