基于HNC理论本体知识库建设初探.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HNC理论本体知识库建设初探

基于HNC理论本体知识库建设初探   摘要 本文根据自己的实践,结合HNC理论的相关知识和本体知识库建设的相关技术,对基于HNC理论的本体知识库建设进行了探索。   关键词 HNC理论;本体;知识库   中图分类号X9 文献标识码A 文章编号 1674-6708(2011)40-0218-02   在自然语言处理(Natural Language Processing,NLP)领域,如何利用计算机高效地理解和处理自然语言日益成为一个核心课题。自然语言处理须以语言知识为依托(黄曾阳,1998:99),它包括语法、语用和语义知识,其中语法知识最早应用于自然语言处理。自20世纪70年代起,对语义知识的研究日益受到重视,研究者们相继提出了语义网络(Semantic Network)、概念依存理论(Conceptual Dependency Theory)、格语法(Case Grammar)等语义表示理论。这些理论的发展和应用使自然语言处理从语法层面深入到了语义层面,完成了形式到内容质的飞跃。   近年来,基于本体(Ontology)形式来表达和组织语义知识的方法成了人工智能领域的研究热点之一,Nirenburg和Raskin(2004)提出了一种基于本体的语义理论,即本体语义学(Ontological Semantics),在这个理论中,本体是析取和表示自然语言文本意义的核心资源。在自然语言处理中,语义分析需要庞大的语义知识库,20世纪80年代以来,国内外发展了一批语义知识库,著名的有WordNet、HowNet、北大的CCD等,从知识表示的角度来说,上述知识库都可成为本体知识库。   概念层次网络(Hierarchical Network of Concepts,HNC)理论是由中国科学院声学研究所黄曾阳研究员创立的自然语言理解和处理的理论体系,它紧扣建立概念联想脉络、模拟大脑语言感知过程这条主线,设计了一套符号体系来表达自然语言的语义知识。作为HNC理论的一大特色,精心设计的符号体系使得HNC理论的多个处理模块环环相扣。这种高度抽象的符号化表达方式新颖简介且便于计算机处理,但另一方面,其符号体系的独特性、系统性和复杂性也增加了人们学习、理解、发展和应用HNC理论的难度。与HNC符号化的表示不同,本体的表示可以将概念间的层次结构和概念之间的关系明确地表达出来,便于人们的理解和应用,同时用形式化描述语言的本体也可直接应用于自然语言的计算机处理。如果将HNC理论对概念的表述用通用的本体形式表示出来,无疑将促进HNC理论的发展和应用,实现人和机器之间的知识共享。   本研究将基于HNC概念基元符号体系所揭示的概念知识,探讨如何采用本体的方法和技术构建知识库,并进行智能查询。   1 本体知识库开发环境   本研究将采用Windows XP Professional SP1作为本体的建构环境与使用环境。所要使用的软件有本体编辑软件Protégé3.4.1和JRE。Protégé3.4.1的安装文件可从下载,它集成了JRE的安装文件,因此无需单独下载JRE的安装文件。   2 本体知识库开发整体思路   综合分析常见本体知识库的功能和特点,紧密结合实际学习过程中的需求,以HNC理论为核心,建立一个本体知识库,并通过Protégé软件对知识进行管理,实现对知识的更新,达到使本体知识库高效率、高质量、低成本的建设目标。   3 知识库设计及主要功能   3.1 知识库体系结构(如图1所示)   3.2 本体构建方法   现有的本体构建方法一般都是本体通过研究组织和团体本体项目开发的经验总结而来的,方法很多但相互之间又有重叠的部分,Noy和McGuinness提出了一个简单的知识工程方法――“七步法”,主要针对领域本体的构建。我们以编辑工具Protégé为例来说明本体构建的步骤。主要步骤如下:   1)确定本体的领域和范围;   2)考虑重用已有的本体;   3)列举本体中的重要的术语;   4)定义类及类的层次结构;   5)定义类的属性;   6)定义属性的限制条件;   7)创建实例。   3.3 知识库主要功能   基于HNC理论的本体知识库主要包括三大模块,即“HNC概念表示”模块、“实例”模块、“查询”模块,下面对每个模块做一介绍。   “HNC概念表示”模块。根据HNC概念节点的语义网络及其相互联系,在模块中把HNC概念以树形图的形式表示出来,通过此模块,我们可以更加清晰直观地观察HNC语义网络中各节点之间的关系,对我们更加深入地研究HNC理论大有裨益。在属于不同级别节点的概念间,我们也可以通过属性的设计建立联系,使概念更加网络化。   “实例”模块。在概念节点的底层我们可以建立实

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档