基于领域本体的信息抽取和知识获取系统毕业设计汇.docVIP

  • 2
  • 0
  • 约2.01万字
  • 约 24页
  • 2018-06-09 发布于浙江
  • 举报

基于领域本体的信息抽取和知识获取系统毕业设计汇.doc

基于领域本体的信息抽取和知识获取系统毕业设计汇

本 科 毕 业 论 文 第  PAGE 24 页 共  NUMPAGES 24 页 1 绪论 信息抽取(IE)是指从自然语言文档中找到特定的信息,是自然语言处理领域特别有用的一个子领域。所开发的信息抽取系统既能处理含有表格信息的结构化文本,又能处理自由式文本(如关于军用飞机的报道)。IE系统中的关键组成部分是一系列的抽取规则或模式,其作用是确定需要抽取的信息。网上文本信息的大量增加导致这方面的研究得到高度重视。信息抽取是自然语言理解技术和实际应用相折衷的产物。自然语言处理有着从根本上解决人机对话问题的良好前景。然而,目前的自然语言处理水平尚不能对任意的文本进行深入的分析,不具备深入理解自然语言的能力。与自然语言理解不同,信息抽取一般不对文本作深入的全面分析,它的主要功能是根据预先设定的任务,抽取特定类型的信息。例如,一个用于关于军用飞机领域的信息抽取系统,只需提取诸如飞机种类、名称、相关性能及用途等信息即可达到要求。信息抽取的优势在于简化了自然语言处理的过程,只关注相关的信息,而忽略无关的内容。 1.1 本文研究的背景及所做工作 为了提高检索的查全率和查准率,国内外的学者专家正在致力于研究基于语义的信息检索,并取得了一定的成果。为广大学者所公认的是在本体的基础上设计信息检索系统,实现信息的语义检索。本文所要做的工作

文档评论(0)

1亿VIP精品文档

相关文档