logo

您所在位置网站首页 > 海量文档  > 专业论文 > 毕业论文

基于语义的中文词义消歧技术分析word论文.docx 55页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
特别说明: 下载前务必先预览,自己验证一下是不是你要下载的文档。
  • 上传作者 zx118123(上传创作收益人)
  • 发布时间:2018-02-14
  • 需要金币250(10金币=人民币1元)
  • 浏览人气
  • 下载次数
  • 收藏次数
  • 文件大小:394.18 KB
下载过该文档的会员
基于语义的中文词义消歧技术分析word论文
你可能关注的文档:
基于语义的中文词义消歧技术研究摘要中文中的词语灵活性造成了一词多义现象的大量存在,这对自然语言处理来说是一个难点,许多自然语言处理领域中的问题最终都是处理词语的歧义问题。如何让计算机能够根据特定的语言环境对一词多义现象进行处理是词义消歧需要解决的首要问题。词义消歧对于许多自然语言处理领域的应用都有非常重要的作用。本文的研究内容主要是基于统计学习理论中有监督的词义消歧方法,这种方法是现今词义消歧领域中较为主流的方法之一。这种方法可扩展性、灵活性较好,可以适应语言的变化和发展,得到了国内外相关研究领域的广泛应用。本文的研究内容主要由以下几个部分组成:首先,本文对词义消歧领域中具有指导意义的方法做了列举和比较,介绍了词义消歧准确率的评判方法和权威评价体系,阐述了仍待解决的影响词义消歧研究的问题。其次,研究了词义消歧的特征提取方法,其中包括语料的解析过程、特征的选择和特征的提取。深入研究了基于语义的特征提取方法,主要包括单层语义信息、三层语义信息、词形信息三种不同的语义信息的提取。同时通过这三种不同的特征提取手段建立特征向量集。利用特征提取中的三种不同的向量集来构建基于语义信息的贝叶斯词义消歧分类器,通过对比实验来验证新方法的词义消歧性能。最后,针对词义消歧在其他自然语言处理分支中的扩展应用做了举例。在机器翻译系统中增加词义消歧模块,来提高机器翻译实际应用中的准确率。虽然研究并不完善,但是也给词义消歧在实际中的应用提供了一些现实意义。关键词自然语言处理;词义消歧;特征工程;机器学习方法;机器翻译ChineseWordSenseDisambiguationBasedonSemanticAbstractThephenomenonofpolysemyiscausedbytheflexibilityofChineseandit isadifficultproblemintheNaturalLanguageProcessing.Manyproblemsof NaturalLanguageProcessingareultimatelyclassifiedassovlingtheproblemsof ambiguousofwords.ItisaprimaryproblemtosolveforWSDthathowtomake thecomputertobeabletodealwiththephenomenonofpolysemyaccordingto thespecificcontext.Wordsensedisambiguationhasanimportantroleinmany applicationofNaturalLanguageProcessing.ThesupervisedWSDmethodbasedonthestatisticallearningtheoryisthe mainresearchcontentofthispaper.Thismethodisoneofmainstreamcurrent methodsinthefieldofwordsensedisambiguation.Thismethodpreferablyhas scalability,flexibilityandcanadapttothechangesanddevelopmentof language.Thismethodhasbeenwidelyapplied inthefieldofdomesticand internationalrelatedresearch.Themaincontentofthispaperisconsistedbythe followingparts:Firstly,inthispaper,themethodofguidingsignificancelistforthefieldof WSDislistandtheevaluationmethodoftheaccuracyofWSDisintroduced. The unsolvedissueofinfluenceonthereserchofWSDiselaborated.Secondly,themethodoffeatureextractionisreserched,includingthe processofcorpusanalysis,featureselectionandfeatureextraction.Themethod offeatureextractionbasedonsemanticsisdeeply,consistingprincipallyofthree kindsofExtractionofdifferentsemanticinformation.Itincludes

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

©2010-2013 max.book118.com在线文档投稿赚钱网. All Rights Reserved 蜀ICP备08101938号