logo

您所在位置网站首页 > 海量文档  > 专业论文 > 毕业论文

基于语义领域信息抽取系统word论文.docx 53页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
特别说明: 下载前务必先预览,自己验证一下是不是你要下载的文档。
  • 上传作者 zx118123(上传创作收益人)
  • 发布时间:2018-02-14
  • 需要金币250(10金币=人民币1元)
  • 浏览人气
  • 下载次数
  • 收藏次数
  • 文件大小:1.25 MB
下载过该文档的会员
基于语义领域信息抽取系统word论文
你可能关注的文档:
AbstractInternethasbecomeanimportantchannelforpeopletoobtaininformation.However,inorder toobtainthedesiredinformation,peopleneedtospendalotofenergyinsearchingforthetarget informationinthecomplicatedWebpages.Targetingaspecificdomain,thispaperpresentsa methodwhichleveragesontologytoeffectivelyidentifyandextractinformationfrom unstructuredWeb pages,thus providingstructureddata forusers.WegroundourworkonthedomainofComputerScience,andextractinformationfromthe WikipediaandotherWebsourcesbasedonsemantics.Firstly,theauthorusessemi-supervised learningmethodtoanalyzeandextractvocabulariesinthefieldofcomputerscience.Secondly, withvocabulariesextractedandthepersonalattributesofcomputerscientists,Ontologyaboutthe fieldofcomputersciencecanbeconstructed,andinordertoensurepersistencyofdata,ontology isanalyzedtoMySQL database.Finally,onthebasisofconstructingandanalyzingtheontology towmethodsare usedtoinformationextraction.One isofflineextractionthatextractsthedomain knowledgefromdatabase,theotherisonlineextractionthatextractstheinformationwhichis not in thedatabase.Thesystem will return theresults of two methods to users.Thisexperimentonprototypeshowsthatourmethodcanextractpersonalinformationof computerscientistswithhighprecision.WecomparedourmethodwiththeTextRunner implementedintheopenIE.Theresultsdemonstratethatourmethodhasasuperiorperformance. Key words:Ontology, Semantic,Information Extraction, Semi SupervisedLearningII目录专用术语注释表1第一章绪论21.1 论文研究的背景意义21.1.1研究背景21.1.2研究意义21.2 国内外研究现状31.2.1信息抽取的研究31.2.2领域本体的研究41.3论文主要内容及章节安排51.4 原型系统的设计61.4.1系统设计目标61.4.2系统整体框架设计7第二章背景知识介绍82.1 信息抽取82.1.1信息抽取系统体系结构92.1.2信息抽取分类102.1.3信息抽取关键技术112.1.4信息抽取的评价标准142.2 本体技术142.2.1本体基本概念142.2.2本体的分类152.2.3本体描述语言162.3 本章小结18第三章领域词汇的抽取193.1 文本预处理193.2 半监督学习方法213.3 算法设计233.3.1抽取规则243.3.2规则匹配253.4评分253.5 本章小结26第四章本体的构建及解析274.1 本体构建274.2.1构建本体314.2.2本体推理344.3 本体解析354.4 本章小结37第五章信息抽取模块385.1 信息抽取385.1.1正则表达式38III5.1.2实体抽取395.2 系统实现395.2.1系统开发工具395.2.2用户界面405.3 实验结果对比分析415.4 本章小结43第六章总结与展望446.1 本文工作总

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

©2010-2013 max.book118.com在线文档投稿赚钱网. All Rights Reserved 蜀ICP备08101938号