- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
专业出版领域知识服务系统设计
摘要:基于开放域的知识服务系统已较为成熟,但是对于传统出版领域,尤其是专业出版领域而言,它还是一个非常新鲜的技术。在分析行业现状及需求的基础上,设计专业出版领域知识服务系统,构建专业领域知识体系,对专业出版领域的资源进行知识化加工及标引,形成知识库,并基于知识库提供面向不同用户的个性化定制服务。
关键词:专业出版;知识服务;知识标引;知识库构建;语义检索
DOIDOI:10.11907/rjdk.161078
中图分类号:TP319
文献标识码:A 文章编号:1672-7800(2016)005-0062-04
0 引言
20世纪80年代,信息服务产生并在世界范围内广泛普及,成为社会信息化的重要标志之一。随着信息技术打破摩尔定律继续以超高速迅猛发展,信息给人们的科研和决策也带来了诸多麻烦。信息元作为信息传播的最小单位,可以不断地连接、组合形成新的结构。信息元的这种无穷组合能力促使新信息不断产生,导致信息爆炸,形成信息烟雾。在众多信息和数据库面前,科研工作者和决策者却感到获取有用信息变得更加困难。为了让人们从“信息超载”和“知识饥渴”的困境中走出来,在知识密集型服务行业中出现了一个新的服务领域――知识服务。知识服务从各种显性和隐性知识资源中按照人们的需要有针对性地提炼知识,是一种用来解决用户问题的高级阶段的信息服务过程,它是一种面向知识内容和解决方案的服务。
区别于传统的信息服务,知识服务是用户目标驱动的服务,面向知识内容的服务,它非常重视用户需求分析,根据问题和问题环境确定用户需求,通过信息的析取和重组来形成符合需要的知识产品,并能够对知识产品的质量进行评价。此外,知识服务是面向解决方案的服务,它关心并致力于帮助用户找到或形成解决方案。同时,知识服务是为用户解决问题工程的过程性服务,帮助用户进行知识的捕获、分析、重组及应用,根据用户需求来动态和连续地组织服务。
1 行业现状与需求
在当前语境下,专业知识服务[1]工作的开展,无论是对出版企业还是技术提供方都提出了较高要求,尤其是在专业知识领域[2],具体要求主要体现在如下几个方面:一是对资源的要求,区别于无体系、无规范及无专业保证的互联网资源,出版社具备专业的编辑团队及知识来源,是开展知识服务的最佳基础;二是对技术的要求,只有依托于先进的技术手段及产品设计理念,才能实现合理的知识呈现、提供良好的解决方案;三是对知识服务的理解程度,在知识服务开展过程中,知识服务提供方要结合自身的资源优势及用户特点,基于对知识服务内涵及外延的了解,建立行业及专业的知识谱系及服务模型[3]。
近年来,国外学界对知识服务概念及范围的研究甚嚣尘上,与知识服务概念研究热潮形成鲜明对比的是知识服务实践开展却相对滞后,能真正系统开展知识服务的机构很少。但是,众多数字出版企业并没有停下前进的脚步,国内外众多出版机构都开展了在该领域的探索,并在探索的基础之上依托多元化的产品形态及运营模式,为用户提供基于知识的服务,为我国出版界开展知识服务建设提供了宝贵经验[2]。
本课题的主要研究目标是提供一套可行的解决方案,满足专业出版领域的知识体系构建、知识加工及标引、知识库构建以及对外提供知识服务的需求。
2 系统架构设计
2.1 系统总体架构
系统总体架构如图1所示。
2.2 资源采集及管理
专业出版领域的资源是专业出版社最核心的资产,将这些资源进行数字化、结构化及知识化,结合构建的知识体系形成知识库,再对外提供知识服务[3],这是本解决方案要实现的目标,也是整体框架设计的依据。
存量资源以图书、期刊等出版物为主,这些资源由于出版时期不同,其存储介质也不尽相同。早期出版物以纸质为主,到了20世纪80~90年代,出现了排版软件,例如方正书版、InDesign等,这时资源存储的介质已经数字化,基本上以方正书版文件、PDF、WORD等形式出现。
对于存量的纸质图书,可以通过扫描、OCR识别形成PDF文件实现其数字化。但是数字化只是第一步,想要获取到知识,还必须将资源进行结构化,本方案中结构化的数据采用XML来描述,XML的标准以国际通用标准配以国内标准的扩展。例如,国际通用的DOCBOOK5.0标准,并扩展中文图书特有的一些属性,从而形成本方案的图书结构化标准。
WORD结构化加工工具是基于微软Office提供的API接口开发的基于WORD的插件,安装后直接在WORD面板中出现一个新的面板,其提供的功能可以对WORD文本进行自动化及人工加工。对于方正书版文件,采用方正经典可以直接导出DOCBOOK标准的结构化资源包;对于PDF,可以通过集成业内成熟的数字加工技术来实现结构化。结
文档评论(0)