- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对关系数据库与XML数据库比较研究
对关系数据库与XML数据库比较研究
摘要:作为当今比较流行的二大数据库,本文主要分析了XML数据库与关系数据库之间的关系,结合实例论述了XML文档的特点,并对XML文档内容到关系数据库的转换提出了一种可行的解决思路。
关键词:XML;关系数据库;转换
1、前言
关系数据库系统采用二维表格作为存储数据的模型,关系数据是结构固定的信息,通过表与表的关联关系来表达数据之间的关系,由于其具有数据结构化、冗余度低、程序与数据独立性强,易于扩充等特点,已成为目前发展的一大主流,很多大型信息系统都是建立在结构化数据设计之上。
而随着Internet的飞速发展,网络信息量急剧膨胀,为了更好地进行信息管理和信息交换,可扩展标记语言XML(eXtensible Markup Language)技术应运而生。XML是SGML的一个简化版本,它将SGML的丰富功能与HTML的易用性结合到Web的应用中。XML较传统关系数据库具有其自身的优势,如XML数据是半结构化的信息,与传统的关系数据库中的关系数据相比,元素之间的关系通过嵌套方式表达,表现形式非常灵活;另外其数据存储不需要使用数据库系统,在任何应用程序中都可以读写数据,使用起来非常简单方便,且数据格式统一,因其可以高效地操作和维护Web上以指数增长的数据,目前已成为网上传输数据的重要手段。
2、XML的特点
首先XML文档可扩展能力强[1],允许用户自定义标签以及这些标签相关参数的属性和值;其次其具有良好的数据可重用性;另外使用XML文档具有较强的平台独立性。XML可运行在任何平台和操作系统上,具有结构化和标准化的文件模式;最后,由于数据可被XML唯一标识,搜索软件无需了解类似传统数据库的构建情况,因此搜索起来会变得十分容易。但XML也有其自身的不足,如DTD没有采用XML的语法规则而是基于正则表达式的,描述能力有限;约束定义能力不足;没有数据类型的支持;不够结构化,重用的代价相对较高。
XML文档主要由XML元素构成。每个XML元素包括3部分:开始标记、元素内容和结束标记。标记包括六个内容:元素(element),属性(attribute),实体引用(entity references),注释(comment),处理指令(processing instruction)和CDATA段。其中标记是用一对尖括号来表示,元素内容可以是文本数据,也可以是XML元素,甚至是该元素本身。其语法和HTML类似,但是XML的优势在于其允许用户可以根据需要自行定义标记,具有十分强的可扩展性。下面是一个XML文档的实例,描述了一个歌手的姓名、性别、所唱曲目等信息。
王菲
女
中国
Pop
传奇
李健
4:20
2010
流年
陈晓娟
3:30
2001
3、XML数据库与关系数据库的比较
XML数据库与关系数据库系统相比[2-3],有如下几方面的差异:1.存储形式:XML数据存储在层次化结构化的文档中,而关系数据库将数据存储在多个表中。2.存储数据:XML结点具有元素和属性二种值,而关系数据库中记录单元只有单一的值。3.存储顺序:XML元素是有顺序的,而关系数据库中记录单元是无序的。4.存储数据特点:XML中元素是可以嵌套的,而关系数据库中记录单元是原子的。5.递归性:XML元素是可递归的,而关系数据库中几乎不支持递归。6.数据检索:XML中可以直接检索一个文件中的数据,而关系数据库往往需要关联检索多个表的数据。7.数据查询:XML用XML标准查询语言Xpath或Xquery查询,而关系数据库用标准查询语言SQL对数据进行查询。
4、XML向关系数据库的转换方案
由上可知XML与关系数据库进行数据转换的最大困难是由非层次和层次的差别而导致的。XML数据是半结构化的信息,元素之间的关系通过嵌套方式表达,有明显的层次结构,而且表示形式非常灵活。而关系数据是结构固定的平面化的信息,数据存储在二维表中,数据之间的关系是通过表与表的关联关系来表达的。在XML向关系数据库的转换过程中,无论何种转换方案,在转换结果中,都既要保持数据源内容的完整性,又要保证数据源结构的可恢复性。因此可采用如下转换规则[4]:
①单值属性和简单元素直接映射表的列。
②由复杂元素构成的表,对其内容分类处理:单值属性和简单子元素映射利用上面第一个规则;对于复杂子元素,形成对复杂子元素对象的引用,关系数据库中,实体间的关系通过外键引用来实现,而在XML数据库中,实体间的关系通过IDREF或XML元素嵌套来实现,因此当元素形成表后,
原创力文档


文档评论(0)