基于知识组织资源仓库领域本体构建的研究.docVIP

下载本文档

1
0
约6.8千字
约 6页
2017-08-30 发布于安徽
举报
版权申诉

基于知识组织资源仓库领域本体构建的研究.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于知识组织资源仓库的领域本体构建研究何琳（南京农业大学信息管理系，南京，210095） Dataset of Knowledge Organization Resources He Lin (Department of Information Management of Nanjing Agricultural University, Nanjing, 210095) Abstracts: This paper describes a methodology to generate ontology from traditional knowledge organization resources (dictionary, taxonomy, classification and thesaurus). The proposed methodology presupposes an evolutionary lifecycle based on successive transformations of the original resources that lead to products of intermediate knowledge representation. It also discussed some important questions in the construction process. Keywords: Ontology Construction; Knowledge Organization Resources; Classification; Thesaurus; Integrated Vocabulary 引言本体构建作为实现本体各项应用的基础工具，在数字图书馆、计算机科学、信息检索等领域得到了广泛的关注。国内外开展了有关本体构建研究的众多研究项目，也取得了很大的进展，但是如何能够自动、高效、低成本的构建本体仍是本体构建研究中的薄弱之处。经过长期的发展，图书馆等情报部门积累了众多的分类表、叙词表等资源，这些资源中蕴含了丰富的术语和语义关系，然而这些资源却没有得到最大化的利用，整合已有的知识组织资源采用自动化的方法来自动构建本体是未来本体构建的主要发展方向。以传统叙词表改造为本体的研究，认为叙词表和本体在本质上有一定的联系，主要的做法是将叙词表中的相关关系进行细化。这方面主要的代表是美国Syracuse大学探索将GEM（教育资料网关）转换成Ontology[1]阿姆斯特丹大学利用AAT建立描述艺术对象的Ontology[2]联合国粮农组织（FAO）尝试将AGROVOC叙词表改造成农业本体[3]国内比较典型的代表为将《中国分类主题词表》进行改造[4]，将汉语主题词表进行本体改造[5]等。这些项目主要采取以人工改造为主的方式，且没有全面地利用和整合所有的知识组织资源，零打碎敲式的选取某个叙词表或分类表将其中的概念关系细化，更多的是偏向采用本体描述语言将叙词表或一体化词表的进行基于的描述，使之机器可处理、可视化，并未形成机器可理解的本体，花费的成本较高，而且叙词表在体系结构、内容更新程度方面都存在一定的滞后性，直接将相关关系细化，与可应用本体之间是存在一定距离的。此外，图书情报机构积累大量以这些传统分类、主题工具标引的大量书目信息，含有大量的未发掘的概念和概念关系，这些都为本体的构建提供了大量的语料，在这些项目中都没有得到很好的体现。知识工程师研究知识获取的方法为领域本体的自动构建提供了一定的思路和方法，国内外都开展了关于本体学习的研究，如AIFB[6]开发了SMES进行句法分析来获取领域概念。ECAI [7]报道了自然语言处理技术用于本体学习抽取代表概念的重要词汇，国内也开展了本体学习的研究，必须承认自动构建本体是本体发展的趋势所在，但是完全依赖自动化技术会产生大量的噪音数据，而且抽取的概念关系较为松散等，在目前已有的本体学习项目中主要侧重关键技术的研究，所构建的本体更多是一种原型系统，缺乏实用性，难以在数字图书馆等实际环境中使用，因此对于领域本体的完全采用以技术为主的自动构建方法和技术还不是很成熟。以上两种构建本体的方法都有各自的优缺点，现有的知识组织工具，如分类表、叙词表、各种专业词典等为本体的构建奠定了很好的语义基础，这些知识组织资源拥有良好的知识基础，构建的过程中曾投入大量的经费和智力劳动，且经过多年的发展积累大量采用这些知识组织工具加工的大量资源，这些资源中蕴含了丰富的未发掘的语义关系和术语。据不完全统计，自上世纪80年代以来，我国共出版了130多部叙词表，由于各种词表分散编制，互不兼容，且缺乏维护和更新，大部分被长期弃之不用，造成了很大的浪费。