基于xML技术历史数据归档与重构的研究应用-计算机应用技术专业论文.docxVIP

基于xML技术历史数据归档与重构的研究应用-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3 3 太原理:1 ::人与f 硕女研究生学位论文 管理系统数据库作为归挡源数据库 ,主要针对网站数据库中过期的历史数据进行归档和 重构操作. 主系统选用 JAVA+TOMCAT+STRU TS2 开发架构进行 )f发 .具体实现的功 能包括: (1)对山西省电力公司省公司同站内容系统,各分公司和各宦属单位同站内容管理 系统的数据库数据进行全面科学分析,合理的划定需要归挡的过期数据的范回. (2) 数据库归梢.对山西省电力公司省公司 ,各分公司和各直属单位的网站内容管 理系统数据库的数据进行归档操作。将数据库中的过期数据导 :JJ为标准泊位文件,另 行存储 。 (3) 文件归档。对山西省电力公司省公司 ,各分公司和各直属单位网站内容管理系 统的网站数据内容,包括所有网站的文章 ,图片,附件,视频 ,其他相关数据信息统 · 进行分类归梢抒 {淌。对仕l抖数据进行重复数据的过滤与删除工作,有放诫少 垃圾数据。 (4) 在分类存储的1JS础上,按照不同的检索标准对归挡文件实现高效地检索查询。 (5) 可以将归档数据恢重新导 入到网站内容管理数据库, 参与系统当前工作. 1.4 论文的组织结构 第一草主要介绍了本课题的开发背景,当前国内外对于该领域的研究动态,介绍 了本文主要的研究内容及论文组织安排。 第二章主要介绍了数据仓库技术 和 XML 技术 。详细介绍了数据仓库的特点,数 据组织方式,归档幸11重构含义以及 XML 技术的定义和1特点, XML 的柏皮策略,以及 为什么妥将 XML 技术号 |入到归档和重构中来。 第二%:J三架对归挡系统的整体架构进行分析和说明。详细介绍了系统的需求分析, 系统体系架构圈,网绵拓扑图 ,功能组成囱等内容。 第四章本章是全文的 ?点,主要介绍了三大功能模块的主要任务,丰丰功能模块的 设计思想和具体实现方法。 第五章本草主要介绍了系统 测试的方法和流程,同时对系统的各 主要功能界面进 行了简单的介绍。 第六章主要介绍了该系统的应用前景,当前存在哪些不足之处,以及将来需要改 进的方向等内容. PAGE PAGE 5 太原理T大学硕价研究生学位论文 第二章数据仓库技术与 XML 技术 2.1数据仓库技术和数据归档与重构 2. 1.1数据仓库的特点 数据仓库 (Data Warehouse ,简称为 DW 或 DWH) 是建业;在原有传统数据库基础 上,具有面向主题、集成性、数据稳定性强以及反映历史变化等特性的数据集合 l习。数 据仓库为决策系统 (D巳cision Support System. DSS)、联机分析数据源、数据挖掘(Data Mining ,DW)等提供结构化的数据环域 。目前,该技术己广泛应用咆信、银行等多行 业信息化建设巾。它有以下几个特点: ( 1)丽向主题 数据仓库中的数据 并不是大量数据杂乱无章地堆积,而 是根据某种 既定策略或主题 进行了重新组织归纳,这样便 于用户从海量数据中查询和提取 有价值的数据信息。 策略 或者主题是个抽象概念,它是对应用系统中的数知进 行综合分析后地 抽象I匀。 (2)集成性 数据仓库中的数据米源于各分散的数据库 。因为各源数据库中数据格式、数据定义 等各不相同,数据仓库中的数据不能从各源数据库中简单抽取得到 。在构建数据仓库的 过程中,数据要按照主题统 一进行抽取,转化和分析处理。这是数据仓库构建过程中的 核心的步骤问。 (3) 数据稳定性 数据仓库主要 为企业提供信息资源分析和企业决策支持,所进行的操作 主要是检索 查询操作。数据仓库中的数据在相对较长的 时间内处于基本稳定的状态。当数据仓库的 数据超过设 定 的时间周期或条件阙值时,才进行 更新、修改等操作。 (4) 反映历史变化 数据仓库中的数据是不断变化的,表现在不断随时间增加新内容,删减旧内容,随 时处理综合信息等。数据仓库中的数据记录了企业各个发展阶段的数据信息,可以全面 反映企业历史变化,为企业的发展提供分析和预测。 太原理 :1.: 人 2. 1.2 数据组织方式 数据仓库中的数据包含四个级别:初期细节数据 、当前细节数据、简单综合数据、 复杂综合数据,如图 2-1 所示15,6]。数据从分散的数据库中被提取出来,经过综合后进入 数据仓库,变成当前细节数据。 当前细节数据根据具体 应用程序 的调用需求,根据策略 运算聚合成简单综合数据 。如有需求进 一w聚合成复杂综合数据。时间长久或调用频率 低的数据被归为初期细 节数据,进行 归挡处理, 1ff苗在较低级别的 存储服务器上。 复杂综合 主H\ 简单综合数以 产ílìíj 细 节放知 fjJ!PI细节 主 因 2-1 数据组织结构 Fig.2-10r毡,aniz.ing structure o

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档