- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
XML在传统出版机构转型中应用
XML在传统出版机构转型中应用
XML(eXtensible Markup Language可扩展标识语言)是国际上定义电子文件结构和内容描述的标准。XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言。虽然不同的应用软件也支持其他的数据交换格式,但不久之后他们都将支持XML,那就意味着程序可以更容易地与Windows、MacOS、Linux以及其他平台下产生的信息结合,然后可以很容易加载XML数据到程序中并加以分析,以XML格式输出结果。
XML推出后被广泛用来作为跨平台之间交互数据的形式,主要针对数据的内容,通过不同的格式化描述手段(XSLT,CSS等)可以完成最终的形式表达(生成对应的HTML,PDF,Epub或者其他的文件格式)。
XML所涉及的
谈到XML,就不得不提到描述XML结构的规范DTD及Schema。我们知道,描述书这个对象时,所用到的元素有书名、价格等,同时书名要用文本来表示、价格要用数字来表示。DTD及Schema就是规定XML中所包含的描述对象的元素及属性的。
DTD及Schema都是用于描述和规范XML文档的逻辑结构的一种语言,他们最大的作用就是验证XML文件逻辑结构的正确性。DTD(Document Type Definition)通过一系列合法的元素来定义文档的结构,是一种保证XML文档格式正确的有效方法,可通过比较XML文档和DTD文件来看文档是否符合规范,元素和标签使用是否正确。Schema 与DTD(文档类型定义)功能相同,同时它本身就是一个XML,因而使用者可以更直观地了解它的结构。除此之外,Schema支持命名空间,内置多种简单和复杂的数据类型,并支持自定义数据类型。所以未来传统出版机构规范元数据的Schema(或者DTD)以及面向一个领域专业的Schema(或者DTD)会成为其核心的价值。可以通过成为行业标准并申请专利的方式成为机构在数字化、互联网时代的核心竞争力。
XML的价值
XML适用于数据的交换
可以兼容不同的平台。在数字化、互联网时代,不同平台之间尤其在数据、内容方面都有大量的交互的需求。这样能提高资源的利用率,减少重复建设的成本。
XML适用于共享数据
通过XML纯文本文件可以用来共享数据。既然XML数据是以纯文本格式存储的,那么,XML提供了??种与软件和硬件无关的共享数据方法。这样创建一个能够被不同的应用程序读取的数据文件就变得简单了。
XML适合充分利用数据
尤其在多类型移动终端发展的数字化、移动互联时代,底层以XML描述的数据可以实现基于这种格式,应用不同的工具集实现数据在不同平台、不同终端、以不同展现形式呈现出来,满足不同用户的需求。
为什么传统出版机构要应用XML
传统出版机构的数字出版项目的核心就是实现数字化、互联网技术与专业内容的融合,与各种平台无缝地整合起来,并通过各种终端将数据、内容第一时间发布出去。对于这样的一种跨媒体的传播形式,XML就是实现此种应用的基础与前提。XML的内容与显示分离的特点,可以实现一次性制作内容,配以不同的样式单,完成多次、多渠道应用。
传统出版机构的内容资源主要是图书、期刊、电子音像产品,抽象出来的资源类型有:图书、期刊、文章、作者、客户元数据信息、各种格式的文档、图片、视频、音频、课件等。这些大量的资源都需要通过标准的数字化方式(转为XML格式)进行制作、存储,作为实现跨媒体应用的基础。
更为重要的是,XML能实现对文档和其他内容的智能化管理,MarkLogic公司负责客户解决方案的副总裁Max Schireson曾指出:“如果XML内容只是由XML包装的简单数据,那么,用户就没有理由不用Oracle或Microsoft的产品。”但是,如果是在复杂的文档和流程中,关系数据库就很难对文档和其他内容实施有效的智能管理了。
传统出版机构如何应用XML
图书、期刊、文章、作者、客户等元数据信息以数字化的形式传播出去,前提就是需要通过XML来进行描述。而涉及正文内容的文档根据应用的需要也以XML来进行描述。图片、视频、音频、课件等对象类的内容资源需要通过XML来描述这些内容对象的相关属性,同时在应用时根据应用端的不同,生成不同应用格式的内容。
构建基础数据
数字化核心的底层数据结构是非常重要的,所以首先需要分析内容对象,比如学术期刊中一篇文章,包含中文题名、英文题名、摘要、关键词等,同时要分析这些数据的属性及数据之间的关联,XML构建一个底层的数据结构表。
下一步就是设计出核心的数据结构描述文件Schema或者DTD(Schema替代DTD已经成为趋势, Schema本身就是一个XML)。Schema样例如下:
文档评论(0)