领域文本知识获取方法及研究及其在考古领域中的应用.pdf

领域文本知识获取方法及研究及其在考古领域中的应用.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

领域史奉知识扶取方j土研咒及韭庄考古领域中的应用t摘要 摘要 互联网时代,信息爆炸,全球一体化,使信息的来源、数量和形式发生了根本的变 化。如何用智能化的手段处理网上的海量文本信息已成为一个十分紧迫的问题.将信息 转变为知识、将信息基础设施发展为知识基础设施是二十一世纪的重要科研方向,旨在 实现。在恰当的时间,以恰当的语言,恰当的粒度,将恰当的信息提供给恰当的人们” 的目标。当前最热门的领域之一是“文本挖掘”,即从巨量的非结构化文本中抽取信息。 这就为文本知识获取提出了新的挑战和迫切需求. 本文主要针对领域概念获取、领域概念上下位关系学习、描述流提取、领域个体知 识获取的方法,以及它们在考古领域中的应用,开展了如下几个方面的研究工作: (I)一种提取领域概念的混合式方法.日前,在信息检索、文本分类、主题跟踪 和探测等文本处理和分析任务中,通常足以“词”作为特征项的。然而这些 词并不一定能忠实地表达文本的内容、类别和主题。这一问题在处理领域文 本时显得尤为突出,已经阻碍了文本处理任务的发展。领域概念首先是一个 词,并为实体概念、或性质概念、或关系概念。领域概念能够更加准确和忠 实地表达文本的内容.本文的混合式方法融汇了规则、统计、句法和语义信 息来识别概念。该方法首次引入主动词和语义角色识别来提取领域概念,提 出了基于语料学习的主动词识别方法,设计了主动词和面向知识获取的语义 模型驱动的语义角色识别方法。通过与分词系统实验结果相比,验证了该方 ‘法的有效性。 (2)多策略的领域概含上下位关系学习方法。领域概念上下位关系学习是指基于 已构建的上下位关系概念对来学习未知的上下位关系概念对.本文提出了三 种学习策略:种子上下位关系概念对驱动和并列语境启发的学习方法、基于 上下位关系语境的学习方法,以及领域概念构词法驱动的学习方法。前两种 方法是根据上下位关系概念对所处的上下文来提取的,第三种方法是根据概 念的内部构成规律来提取的。这些方法是由学习Agent来完成的,它由已知 知识、学习条件和获取知识三部分构成,采用框架和一阶逻辑表示,因此学 习Agent具有良好的扩展性。 (3)一种领域本体驱动的描述流提取方法。通过信息检索、文本分类和主题检测 和跟踪等文本处理和分析等任务,我们能够了解文本的内容。但是,我们仍 然难以知道文本描述了主题的哪些方面以及它们的描述顺序。因此,我们提 出了一个新的文本分析任务——描述流提取。描述流是指文本的主题、主题 的描述方面以及它们出现的偏序关系。本文采用了一种领域本体驱动的描述 流提取方法,描述流提取是为领域个体知识获取服务的。通过实验验证了该 方法的可行性。 领域文奉知识获取方j杰研究及戴在Z古颈域中的应用t摘要 (4)一种牺驱动的多层语境的领域个体知识获取方法。首先根据槽词汇在文本中 的出现情况,将槽分为显式槽,隐式槽和混合槽。然后根据槽的分类提出了 三种领域个体知识获取方法。第一种是本体层级语境与槽驱动的显式槽的知 识获取;第二种是本体层级语境与槽值驱动的隐式槽的知识获取;第三种是 语言层级语境驱动的隐式槽的知识获取.以往知识获取方法中采用的语境是 基于语言层的,一个语言层语境只能提取个体的一个或几个槽的槽值.本文 提出了一种本体层语境,是语言层语境的一种抽象和概括,一个本体层语境 可以提取个体的一类槽的槽值.它是从本体的角度为知识获取而设计的.根 据语境构成、语境关系、语境内容和共享性构建了语境的分类体系,从而将 庞杂繁多的语境进行了有机地组织和分类。 (5)语境的构建、扩充、匹配和验证方法.语境是进行领域个体知识获取的重要 依据,语境的数量和质量对获取知识起着举足轻重的作用。为了快速准确地 获取大量领域知识,需要研究语境构建、学

文档评论(0)

sjatkmvor + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档