基于汉语框架网络本体问答式语义检索系统分析与设计.docVIP

基于汉语框架网络本体问答式语义检索系统分析与设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于汉语框架网络本体问答式语义检索系统分析与设计

基于汉语框架网络本体问答式语义检索系统分析与设计   摘要 通过对检索资源及用户检索提问的语义解析,采用基于概念图匹配的语句相似度计算方法,不仅可得到与检索条件精确匹配的信息资源,而且还能查询到与检索条件语义相关的隐含信息资源,提高信息查全率和查准率。最后,用一个语义检索实验系统验证系统分析与设计的可行性和有效性。   关键词 语义检索 框架网络 本体 语义匹配   分类号 G354.4      1 引言      关于语义检索,目前学术界还没有一个确切的定义。有人认为:语义检索是把信息检索与人工智能技术、自然语言技术相结合的检索。它从语义理解的角度分析信息对象与检索请求,是一种基于概念及其相关关系的检索匹配。也有人将语义检索称为概念匹配,匹配在语义上相同、相近、相包含的词语。它是对检索条件、信息组织以及检索结果显示赋予了一定语义成份的一种新的检索方式。作者比较赞同“语义检索是一种基于语义理解技术的智能信息检索”的观点,它是指应用先进的智能理论及其技术,对信息资源和用户提问进行一系列的语义解析,通过挖掘其深层含义,充分、精确地表达知识资源和用户需求,进而在各类异构的数据库、数据仓库、知识库中进行检索,并对检索到的信息进行智能化处理之后,返回最相关的结果的检索机制。本体作为一种知识库,在这种检索机制中扮演着重要的角色。   笔者所设计的向用户提供自然语言检索入口的基于汉语框架网络本体语义检索系统,旨在利用已构建好的框架库、词汇库、例句库等知识库,依赖于框架及框架之间的关系及语义类型限制,以语义标注的法律语料库为受限领域,实现基于用户的自然语言提问的语义匹配检索,最终给出用户真正有用、精确、简洁的答案。这将在一定层面上解决问答系统中纯粹的字面匹配、显式匹配等存在的问题。      2 汉语框架网络本体库与语料库      利用框架语义学原理,参考美国加州大学伯克利分校的FrameNet工程,以法律领域为研究对象,构建了法律汉语框架网络本体。      2,1法律框架网络本体的构成   法律框架网络本体??以语义框架为核心,其构成元素包括语义框架、框架元素、词元以及框架间的关系。此外,还有对框架、框架元素及词元进行语义分类的本体语义类型。   2,1,1语义框架(Frame)作为框架网络本体的基本组成单元,语义是对该领域核心概念的描述。一个语义框架,相当于跟一些激活性语境相一致的一个结构化的范畴系统。   2,1,2框架元素(Frame Element,FE)一个语境涉及的各种参与者、外部条件和其他概念角色,它们被称为是该语义框架的框架元素。   2,1,3词元(Lexical Unit,LU) 某种语境在言语中被一些词语激活,而理解语言中词语意义,必需先具备概念结构,即框架语义的知识。这样的词语在框架网络本体中被定义为框架的词元。   2,1,4框架关系(Frame Relation,FR)   框架关系包括框架与框架间的关系及其包含的框架元素之间的关系。目前所定义的框架间关系有继承、总分、参照、透视、起始、使用、致使和先后关系。   2,1,5语义类型(Semantic type,ST)   语义类型是无法用框架、框架元素及框架关系等表达的一些通用语义,它表示词汇固有的、本质的、上下文无关的语义特征。主要用于对框架、框架元素和词元所指称的事物或现象进行分类。它们以一定的逻辑关系构成一个语义类型结构体系附加在框架、框架元素及词元之上。   例如,语义框架“盗窃”(theft)表达这样一个概念或语境:以非法占有为目的,秘密窃取数额较大的公私财物或者多次盗窃公私财物的行为。这一事件(语境)会涉及犯罪者[perp]、受害者[vict]、被盗财物[goods]、作案工具[inst]、发生频率[frequ]、时间[time]等角色及因素,它们都是盗窃框架的框架元素。其中,框架元素犯罪者[perp]、受害者[vict]的语义类型是“有知觉能力者”(sentient),被盗财物[goods]的语义类型为“物理实体”(physical_entity)。不同语义类型之间以通过子类关系(subelassof)相互关联。在具体的语句中,词“盗用”、“偷窃”、“偷”“行窃”、“盗窃”等类似的词都可以激活一个“盗窃”语义场景,它们就是盗窃框架的词元。“盗窃”框架与另一个框架“犯罪”(commiting crime)框架之间是继承关系,表示前者是后者在概念及语义上的细化。   法律框架网络本体以语义框架为核心,通过框架的内部关系和外部关系将词汇进行联系,构成一个巨大的网状数据库。框架的内部关系包括框架与框架元素的关系(hasFE)、框架与词元的关系(hasLU)。框架的外部关系包括各种框架关系以及相关联框架

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档