- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘
摘要
摘 要
隐喻是自然语言处理领域最棘手的问题之一,这个问题逐渐引起了学者们 的关注,并且隐喻在思维及语言中所处的中心地位也逐渐为自然语言处理研究 者所认同。隐喻是通过一个事物来表达另外一个事物,它不仅是~种修辞手段, 而且体现着人的一种类比认知和思维方式。实际上,隐喻现象是一切自然语言 中普遍存在的现象,是自然语言处理不可回避的问题,因此隐喻问题若得不到 很好的解决,将成为制约自然语言处理和机器翻译发展的瓶颈。
近几年来,在隐喻识别方面,机器学习方法和大规模知识获取成了新的亮 点。本文选择汉语文本中的隐喻计算问题作为研究对象,以隐喻识别为研究内 容,从名词性隐喻和动词性隐喻这两种最主要的隐喻类型入手,采用多种机器 学习算法,广泛地探讨了隐喻的识别方法。
本文选择了20个常用的隐喻词语,使用2001年-2004年的《人民日报》语 料进行隐喻识别研究,主要研究内容如下:
基于有监督学习的隐喻识别。针对名词性隐喻和动词性隐喻这两类主要的 隐喻类型,提出了基于RFR SUM模型、SVM算法、CRF模型、最大熵模型和语 义相似度计算模型的隐喻识别方法。分类方法为识别隐喻提供了一个机器识别 的思路,考察了主流的分类方法在识别隐喻时的性能和效果。其中,RFR SUM 模型识别性能比较稳定,名词性和动词性隐喻的正确率的稳定性保持地最好。 另外,CRF模型的识别正确率比SVM算法的略高,但是效果最好的是语义相似 度计算模型。这个模型在采用K近邻分类算法的基础上,融入了语义相似度计算, 使它的隐喻识别性能得到提高,是五个模型中隐喻识别正确率最高的。此外, 对五个模型的实验结果进行了基于投票的集成实验。使隐喻识别正确率得到提 升,名词性隐喻正确率达N87.74%,动词性隐喻正确率达N85.27%。
基于聚类算法的隐喻识别。在聚类过程中,样本间的相似度使用了基于同 义词词林的向量空间相似度计算和基于知网的语义相似度计算两种方法,采用 K.means算法原理,并对K-means算法的随机选择初始聚类中心的方法进行了优 化。聚类实验设计了三个方案来提升隐喻识别结果的正确率,其中方案二不仅 利用了近距离搭配信息,也考虑了远距离的特征信息,使实验结果得到提高。
基于半监督算法的隐喻识别。探讨了利用K.means算法和RFR SUM模型对 隐喻识别进行半监督学习的方法,该算法是在分类实验和聚类实验的基础之上 实现的。不仅利用了已标记样本的信息量,而且运用了未标记样本提供的信息, 提高了隐喻识别的正确率。
摘要最后,构建了用于隐喻计算的小型隐喻知识库。在隐喻研究的实验结果基
摘要
最后,构建了用于隐喻计算的小型隐喻知识库。在隐喻研究的实验结果基 础上,利用算法抽取隐喻类的特征词,并把特征词依据对应的RFR值进行排序, 建立基于隐喻特征—-RFR值这种结构的隐喻知识库。此外,通过基于知识库的 隐喻计算实验,验证了构建的隐喻知识库的有效性。
总之,本文的研究工作主要是基于机器学习算法和知识获取方法,探讨了 各种机器学习算法进行隐喻识别的实验思路,避免了手工知识库和规则方法的 不足,积累了多种机器学习算法进行隐喻识别的大量实验数据,获得了隐喻识 别研究较理想的实验结果。本文研究方法可以为隐喻计算、隐喻理解、隐喻本 体研究及自然语言处理相关研究提供支持。
关键词:隐喻识别,机器学习,分类算法,聚类算法,半监督学习,知识获取
Il
AbstractAbstract
Abstract
Abstract
As one of the intractable problems in field of NLP(Natural Language Processing),metaphor has attracted more attention from researchers in recent years. And researchers have realized that it is the focus of mind and language mechanism. Metaphor is to express one thing in terms of another based on some similarities between the two things.It is not only a rhetorical devices of language,but also embodies people’S analogical cognitive and way of thinking.In fact,the metaphor is prevalent phenomenon in all of the natural language.Also the
您可能关注的文档
- 基于混合方法的电子商务推荐系统的研究与应用-计算机应用技术专业论文.docx
- 嫁接茄子根系分泌物生化特性及其对黄萎菌化感作用的研究-蔬菜学专业论文.docx
- 基于机器学习的汉语情感极性分类方法研究-计算机科学与技术专业论文.docx
- 嫁接提高番茄耐盐性的生理机制研究-蔬菜学专业论文.docx
- 基于机器学习的河网糙率反演-市政工程专业论文.docx
- 基于混合方法的柔性材料建模的研究与实现-计算机应用技术专业论文.docx
- 基于混合方法的室内电波传播特性研究-电磁场与微波技术专业论文.docx
- 基于混合仿真平台的空调系统故障诊断方法研究-制冷及低温工程专业论文.docx
- 基于混合分布的VaR估计及其应用-应用经济学专业论文.docx
- 基于机器学习的火灾检测方法研究-通信与信息系统专业论文.docx
- 尖晶石型铁酸盐复合光催化剂的制备及光催化性能研究-物理化学专业论文.docx
- 基于机器学习与人工免疫的入侵检测系统研究-电路与系统专业论文.docx
- 尖晶石型铁氧体的合成及多铁性研究-化学工艺专业论文.docx
- 基于机器语言的移动代码安全研究-计算机软件与理论专业论文.docx
- 尖晶石正极材料的单元与多元掺杂改性研究-应用化学专业论文.docx
- 基于混合逻辑动态的PHEV模型预测控制-车辆工程专业论文.docx
- 基于机器指纹的身份认证与许可证授权系统的设计和实现-计算机系统结构专业论文.docx
- 尖锐湿疣病变的人乳头瘤病毒分子流行病学研究及L1序列多态性分析和在原核表达体系中的表达-皮肤性病学专业论文.docx
- 基于混合逻辑动态的混杂系统建模和控制方法研究-控制理论与控制工程专业论文.docx
- 尖锐湿疣病损组织粗提蛋白对树突状细胞免疫功能影响的实验分析-皮肤性病学专业论文.docx
文档评论(0)