一种复杂XML格式之间转换解决方案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种复杂XML格式之间转换解决方案

一种复杂的XML格式之间转换的解决方案   摘要:随着网络技术的迅速发展,越来越多的信息被以XML文档形式来交换。XML具有开放性、自描述性和平台无关性,近来己成为网上应用系统间数据交换的标准。本文提出了一种复杂的XML格式之间转换的通用解决方案,解决了商务通信系统中不同XML格式文档的数据转换问题,使得行业数据传输和表达按照行业规范自动分析和处理。   关键词:XML;格式转换;文档      随着互联网应用需求及其相关支撑技术的发展,XML[1]的元语言特性及其本身良好的结构性使它成为互联网异构环境中各种不同类型和不同领域数据相互交换的开放标准。XML格式之间的转换是XML技术领域内的一个比较常见,且又是一个很重要的题。即使是在同一个行业的内部,数据文档的XML Schema之间的差距也非常大。企业信息系统的集成,数据信息的交换等都需要进行XML数据格式之间的转换工作。本文提供一种更适合于解决复杂的XML格式之间转换的解决方案。该方案成功的解决了PDF的XAF文件格式,FileNet表单文件格式到IBM Lotus Forms表单文件格式的转换工作。      1 一种XML格式之间转换的构架      不同XML格式之间的转换工作是常见而又非常重要的。在IT领域,为了解决这一问题,各种新方法、新技术层出不穷。比如利用XSLT[4]等技术进行XML数据格式的转换,XSLT(Extensible Stylesheet Language Transformations)是一种基于XML的一种语言,用以将一种XML格式数据转换为另一种XML格式数据,也可以转换成任意其它格式的数据。而对于复杂转换经常是困难的,甚至是不可能的。又比如RDF/RDFS/OWL技术(XML Schema是用来定义XML文档结构,而RDFS/OWL(本体描述语言)则定义了文档词汇,提供了一种共同的理解)。本文提出了一种XML格式之间转换的方案构架。如图1所示。         图1 XML格式转换框架      原文件(XML格式)通过解析器(Parser)解析生成数据信息,并存储在数据模型里。数据模型是整个构架的核心部分。数据模型主要是基于目标文件的XML Schema[2]而构建的,也可以基于目标XML文件的领域知识构建。它可以是普通的数据模型,也可以是基于EMF(Eclipse Modeling Framework)的数据模型。在对原XML文件进行解析的过程中,解析器要根据基于原文件和目标文件的XML Schema文件而生成的映射表中的信息,做相应的解析优化处理。   在输出目标XML文件之前,优化器和转换规则先后对数据模型中的数据信息进行相应处理。配置文件在构架中的作用是用来管理优化器和转换规则的。用户可以根据业务逻辑的需要通过配置文件来定制优化器和转换规则。可以看出这种解决方案的简单灵活性,可复用性和可扩展性。只需为不同的原文件提供一个解析器就扩展了构架的应用。      2 构建XML格式转换的数据模型      2.1 模板及其性质   数据模型是用来存储解析进来的数据信息的,它是构架的核心部分。目前有两种构建数据模型的办法:普通的数据模型和基于EMF技术构建的数据模型。   普通的数据模型是应用普通的Java类来构建,主要是基于目标文件的领域知识,通常是结构化的数据模型。这种模型构建的优点是简单、通用,主要的缺点是需要构建输出模块从而把模型中的信息输出为满足目标XML Schema的XML文件。图2显示了在电子表单领域中应用的结构化数据模型片段。         图2 电子表单领域的结构化数据模型片段   基于EMF技术构建数据模型的技术已经相当成熟。我们主要应用目标文件的XML Schema来构建EMF数据模型。基于EMF的数据模型具有事件通知机制和持久化方面的支持。因此,模型带来的最大的好处就是开发者不必自己动手构建输出模块。   模型的构建是XML格式之间转换的关键。构建的模型应当满足应用程序的需求(对照映射表,模型要完全支持原文件中的可匹配信息),不要求模型囊括相关领域的所有通用知识,但模型提供给原文件解析器的API应该简单易用,模型要具有高可扩展性和良好的可维护性。      3 优化器(Optimizers)在解析原XML文件中的应用   当原XML文件中的信息被解析进来,并存储在已经建立的数据模型里,此时的数据模型称为原始数据模型,模型里面的数据信息称为原始数据信息。我们根据目标XML文件的特性,需要对原始数据信息进行优化处理。可以根据需要创建若干个Optimizers。            根据电子表单领域的实际需要,我们创建了很多Optimizers。举

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档