- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于xml的文档资料管理上
1 文档资料的问题
万维网是一个分布广泛、全球范围广泛的信息服务中心。它包括新闻、广告、消费信息、金融管理、教育、电子商务和许多其他信息服务。因此,高效资源和web知识的管理具有很大的挑战。
目前文档管理所面临的难题主要表现在以下几个方面。 (1) 文档资料的数量极其庞大。当前万维网上的文档资料过于庞大, 其数据量以兆兆字节计算, 而且仍然在迅速地增长。 (2) 文档资料的组织形式多种多样。目前的文档资料以不同的格式存储于不同的数据组织形式之中, 其中包括文本数据、关系数据库数据、面向对象数据库数据、文件数据以及声音、图像、邮件等。 (3) Web页面的复杂性高于任何传统的文本文档。Web页面缺乏统一的结构, 它包含了远比任何一组书籍或其它文本文档多得多的风格和内容。
为解决以上问题, 就必须实现文档的同一性结构组织, 和页面内容的有效的标识和索引。所谓同一性结构组织, 意即数据文件的组织结构不依赖于系统平台和数据库管理平台;实现页面内容的有效标识, 即将数据信息与格式信息相分离, 从而以有表述能力的标签语言表达文档内容。
2 基于rssp的意义具有形成了xm-l-pcp的注意条
XML技术作为文档管理难题的解决手段已经日益被人们接受和采纳。一方面, 大量的原始信息开始通过特定的转换机制, 整合为XML数据;另一方面, 未来将会有大量的Web页面用X M L书写, 并遵循一组良好的文档类型定义, 从而有利于促进不同W e b站点间的信息交换, 更便于实现对各种组织形式的海量文档资料的有效管理。
XML的最大优点在于它的数据存储格式不受显示格式的制约。一般来说, 一篇文档包括三个要素:数据、结构以及显示方式。XML把文档的三要素独立开来, 分别处理。首先把显示格式从数据内容中独立出来, 保存在样式表单文件中, 这样如果需要改变文档的显示方式, 只要修改样式表单文件就行了。XML的自我描述性质能够很好地表现许多复杂的数据关系, 使得基于X M L的应用程序可以在X M L文件中准确高效地搜索相关的数据内容, 忽略其他不相关部分。XML还有其他许多优点, 比如它有利于不同系统之间的信息交流, 并有希望成为数据和文档交换的标准机制。
3 创建系统配方
本节主要描述基于XML的文档管理, 内容包括以下几个方面: (1) XML数据存取机制; (2) XML与数据库; (3) XML文档创建; (4) XML文档类型定义; (5) XML文档的显示。
3.1 数据库的应用
从整体上讲, X M L定义了应用间传递数据的结构, 而且这种结构的描述不是基于二进制的、只能由程序去判读的代码, 而是一种简单的、能够用通用编辑器读取的文本。XML数据源多种多样, 根据具体的应用, 大概可分为下面三种:一种是XML纯文本文档, 第二种是关系型数据库, 第三种则来源于其他各种应用数据, 如邮件、目录清单、商务报告等。其中, 第一种来源, 即XML纯文本文档是最基本的也是最为简单的, 将数据存储于文件中, 其最大的优点在于可以直接方便地读取, 或者加以样式信息在浏览器中显示, 或者通过DOM接口编程同其他应用相连。第二种数据来源是对第一种来源的扩展, 其目的是便于开发各种动态应用, 其优点则在于通过数据库系统对数据进行管理, 然后再利用服务器端应用 (如ASP, JSP) 等进行动态存取。这种方式最适合于当前最为流行的基于三层结构的应用开发。
3.2 关系数据库中的表与表之间的关联
数据库提供了对于大批量数据的有效存储管理和快速信息检索、查询的功能。从体系结构上看, 数据库技术的发展历经了网络型数据库、层次型数据库、关系数据库、面向对象数据库。虽然面向对象数据库融入了面向对象技术, 但是到目前为止, 在各个领域使用最广的还是关系数据库。关系数据库管理系统采用二维表格作为存储数据的模型, 表格由行和列组成, 一般情况下, 列被称作“字段”用于表示组成数据有效信息的属性, 而行则用于指示一条完整的数据记录。由于数据间的相关性可以通过表与表之间关键字来关联, 由此产生了“关系”类型数据库的由来。针对XML数据, 一般有两种存储方式:一是将其按结构层次拆分开来分别存于不同字段, 二是将XML文档原封不动地存入数据库。
3.3 ent的关系型数据库
现在假定文档保存在一个名叫document的关系型数据库中, 其中有football表, 包含了甲A联赛的报道。可以定义以下X M L文档结构:
3.4 属性的互动关系
文档类型定义详细描述了一组文档结构规则, 提供了一连串的元素、属性、表示法和文档中的各种实体以及其相互间的关系。对应于上面的X M L文档, 可以进行下面的文档类型定义:
3.5 web服务器xll
X S L是为X M
原创力文档


文档评论(0)