- 73
- 0
- 约5.88千字
- 约 10页
- 2016-11-22 发布于北京
- 举报
XML结构化数字出版的特点与流程.doc
XML结构化数字出版的特点与流程
XML结构化标引是传统出版的数字化转型核心,出版社的图书或期刊资源只有通过XML结构化转换,才是真正意义上的数字化出版,才能为实现数字产业化、知识集成化发展打下坚实基础。
一、传统出版机构XML数字转型的必要性
我国2014年6月发布的数字出版统计数据显示,我国的数字出版产业正处于高速增长阶段。另据数据统计,全国584家出版社中有256家有数字出版相关产品,但其中只有102家设有数字出版机构,这些出版社的数字化进程,以大学出版社、科学技术出版社、教育出版社为代表走在前列。虽然发展势头良好,但由于类型单一、投资规模不大,没有出现像爱思唯尔、施普林格那样的数字出版企业。大多数传统出版企业的数字出版仍然基于传统出版模式,即单纯的纸质内容数字化或电子化,只是载体形式的变化,而不是产品内容结构的变化,出版社没有对内容资源进行多媒体呈现与集成化、结构化处理[1]。
结构化是数字转型的核心,结构化的首要环节是建立数字化标准,知识分类的基本单元不再基于某一篇文章,而是以文章结构以及词语为基本单元,通过语义标签对文章进行结构化处理。所以,结构化标准是数字化过程中的重要标准之一,结构化质量的好坏直接影响数字化的水平。
在学术出版领域,各大数字出版厂商和数字图书馆也开始规划构建用于文献存档的XML规范,如NLM DTD、AIP(美国物理学会)、BMC、PlosOne等。
另外,文档结构化也是出版社实现数字化编辑系统的核心,数字编辑平台无论是在工作效率上,还是在工作质量上,都远远超过传统编辑出版模式[2]。
二、 XML结构化数字转型的特点与优劣性
1.XML结构化的几个重要环节
首先,采用新技术。即对传统出版资源进行结构化整理,按照语义标准进行分类、存储。传统出版的电子版内容资源仅仅是服务、排版与印制,只包含标题、正文等格式控制命令,没有按照语义标准进行结构化整理,也就无法实现语义检索与分类,所以要采用新技术,通过XML结构化语言对原始资源进行加工与整理。
其次,改造出版流程。传统出版机构要大力开展网络出版业务,或设立完全市场化的数字出版公司。数字化出版可以依托传统的编、印、发环节基础,通过新技术改造,加之与互联网整合形成新的产业模式。随着产业融合的逐渐深入,在数字化浪潮的推动下,原本严格区分的行业边界会愈发模糊,内容提供商、技术提供商和渠道运营商之间的相互融合会越来越紧密。
最后,出版资源数字版权授权解决方案。由于数字出版具有海量存储、搜索便捷、传输快速、互动性强、成本低廉等特点,已经成为战略性新兴产业和出版业发展的主要方向。数字出版的特点也是数字版权面临的问题,政府与企业应加快技术创新和标准制定,为版权保护提供有效的技术手段;同时加大对数字版权侵权盗版行为的打击力度,切实保障著作权人合法权益。
2.XML标记语言的特点
结构化的本质就是为文档建立一个描述框架,通过标识符使文档任一部分(任一个元素)都和其他部分保持关联,关联的级数就形成了结构。标识本身的含义与它描述的文档信息相分离。结构化文档(Structured Document)是由标题、章节、段落、图表、公式等框架结构组成。
XML正是具备这一特性的扩展性标识语言。XML文档是由 XML元素组成的,每个XML元素包括一个开始标记(),一个结束标记()以及两个标记之间的信息(称为内容)。XML允许无限的标记集,各标记集并不表示如何显示,而是表示其含义。例如,可以将XML元素标记为标题、作者或工作单位,等等。
3.XML结构化优势与劣势
XML最初就是为信息标准化所设计,选择XML作为稿件存储格式有下述优点:
(1)树状层次信息结构存储稿件的内容,可以方便地提取索引。即按照父子关系节点存储文档的内容,可以通过统一的XSL模板对文档稿件进行批处理,经过结构化的稿件可以方便信息的提取与索引。
(2)完全以内容为中心,从而分离了不必要的格式信息。对于每一篇稿件,XML可以以树状信息结构存储稿件的内容,忽略排版格式信息,从而实现语义层面上对文档的定义。
(3)只要设计统一的模板即可格式化为单独期刊具体页面格式。可以依据各期刊和图书体例的统一性设计转换模板,实现XML统一转换。
(4)有利于资料的共享和标准化。经过转换的所有文档,可以方便地建立全文数据库,实现内容资源的统一管理,实现知识提取、知识比较、知识关联。并针对选题策划等各种任务需求实现资源共享,实现个性化、片段化、碎片化出版。
(5)可以方便地转换为任意的格式,如HTML、PDF 、RTF等格式,实现多渠道出版。
选择XML作为稿件存储格式有下述缺点:
(1)出版商要
您可能关注的文档
- PC 桥梁的顶推施工技术简析.doc
- PC+ 时代搭建智能家居平台的探索与研究.doc
- PCC架构下业务流量管控应用场景及策略研究.doc
- PDCA循环在国家出版基金项目编校质量控制中的应用.doc
- PDMS在化工管道设计中的应用.doc
- PDM系统贯彻标准化的探讨.doc
- PDS数据库容灾管理机制与策略研究.doc
- Photoshop抠图技巧与方法.doc
- PLC在低频时变信号处理中的应用.doc
- PLC在压力机控制系统中的应用研究.doc
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
最近下载
- 2025年陕西省汉中市某中学小升初入学分班考试英语考试真题含答案.docx VIP
- DB31T 1236-2020 未成年人司法社会工作服务规范.docx VIP
- 宣贯培训(2026年)《DLT 2772—2024火力发电厂输煤廊道巡检装置技术规范》.pptx VIP
- 2026年北京中考白皮书.pdf VIP
- 2025届苏锡常镇高三(一模)数学试题及参考答案.pdf VIP
- 《人工智能辅助的翻译技术》课件.ppt VIP
- 沉浸式非遗体验—宋代点茶.pptx VIP
- PET Complete精品教学课件 unit 3 having fun.pptx
- 年产2万吨马铃薯全粉项目可行性研究报告.docx
- 《计算机网络基础》课件——OSI参考模型.pptx VIP
原创力文档

文档评论(0)