- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于工具书语料国史知识库构建和检索
基于工具书语料国史知识库构建和检索
〔摘要〕工具书语料是构建知识库的基本知识来源。本文给出基于工具书语料的知识库构建和检索流程,从概念关系模型构建、初始实例获取和知识库编辑等方面探讨基于工具书语料的国史知识库构建;除了实现对象属性检索和语义关联检索外,利用工具书衍生的变体词表还可以实现问答式检索。文章还指出工具书语料在知识来源揭示、超文本检索方面的作用。
〔关键词〕工具书语料;国史;知识库;语义检索
DOI:10.3969/j.issn.1008-0821.2016.01.012
〔中图分类号〕G25492〔文献标识码〕A〔文章编号〕1008-0821(2016)01-0064-10
〔Abstract〕Refrence books are basic resource in building knowledge base.This paper gave the process of building and retrieval knowledge base using reference books.It researched the role of reference books in the knowledge base building from the perspective of concept relation model building,the initial instance acquisition and knowledge base editing.The variant terms derived from reference books can help realize question-and-answer retrieval.It also pointed out the role of reference books in hypertext retrieval.
〔Key words〕reference books;Chinese history;knowledge base;semantic retrieval
利用语义技术构建历史领域知识库,增强历史认知,促进历史普及,辅助历史研究或资源检索,已经成为重要的知识服务方式。武汉大学董慧教授早在2006年就以《国共合作通史五卷本》为蓝本构建国共合作历史本体[1],2014年又以中华书局出版的《二十四史》为蓝本实现中华史籍语义分析系统[2-4],吴丽杰[5]通过人工构建东北抗战史本体辅助资源组织,彭炜明以《资治通鉴》为蓝本构建资治通鉴本体[6]等,上述文献面向不同时代的历史知识领域,在概念关系模型构建、信息抽取、语义推理、知识库检索和资源组织等方面做了有益的尝试。由于历史领域知识存在模糊性和不确定性,选择史料而不是一味依靠专家头脑中的知识作为知识库的知识来源,能够保证知识库的严谨和规范,其知识有据可查,这种构建方法越来越成为一种趋势。历史学科的特点是,越是近期的历史,史料越丰富。中华人民共和国史(简称国史)指1949年建国以后的历史,这段时期的史料比古代史和近代史的总和还要多。如何选择合适的历史语料作为国史知识库的知识来源,是构建国史知识库必须考虑的问题。本文认为,大型词表、词典、百科类的工具书由数位领域专家数年集体创作而成,是对领域知识提炼加工的结晶,其体例、选材、文字组织和术语表达都有一定规范,包含了学科领域的基本知识。固化在工具书中的知识具有权威性、完整性、规范性、一致性,对于构建领域知识库来说,工具书是高度浓缩、转化度比较高的语料。因此,建议借鉴自然科学领域利用叙词表构建领域知识库的经验[7],研究国史知识的语义揭示和组织方法[8],利用工具书语料构建国史领域基本知识库,再通过其他研究成果类语料对知识库进行补充。本文首先给出基于工具书语料的知识库构建和检索流程,从概念关系模型构建、初始实例获取和知识库编辑等方面探讨基于工具书语料的国史知识库构建,除了实现对象属性检索和对象语义关联检索外,还利用工具书衍生的变体词表实现问答式语义检索,并指出工具书语料在知识来源揭示、超文本检索方面的作用。本文重点介绍工具书语料在国史知识库构建和检索中的作用,关于本系统架构和功能平台实现,另文讨论。
1基于工具书语料的知识库构建和检索流程框架
参考文献[9]提出的知识采集模型,本文在文献[10]提出的七步法基础上,提出基于工具书语料的知识库构建和检索流程,如图1所示(单线箭头表示知识库构建流程,双线箭头表示知识库检索过程)。
21概念模型构建
211从工具书种类和目录中提取核心概念及其层次关系
国史工具书一般为人物名录、地区名录、机构名录、大事年表等,这些图书的类型本身就反映了“人物”
原创力文档


文档评论(0)