- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据仓库的洪水水位预报模式的研究
吴爱华
河海大学研究生院,南京,210098
摘薹本文依据洪水预报需求,提出了洪水预报系统模型,描述了基于数据仓库的洪水预报系
统的框架,并讨论了其中的关键技术。
关键词洪水预报.数据仓库,模式
1 引言
我国地域辽阔,河流众多,是一个洪涝灾害频繁的国家。建国以来,每年平均受灾面积为
1。22亿亩,成灾面积为6720万亩,平均不到两年就发生一次较大洪灾,每年都因洪水灾害造
成一定损失。
面对防汛面临的严峻形势,水利工作需要全面提高效率与能力,在充分利用工程措施提高
防洪决策能力、改变水资源现状的同时,广泛应用现代化技术,如数据仓库和数据挖掘等技术
的运用。尽管信息技术在防洪调度和水资源管理业务中得到了一定程度的应用,但总体上还
处于信息源建设和信息一般统计查询阶段,信息资源的开发程度较低。
信息技术的发展正沿着从在线事务处理向在线分析处理、从数据服务向信息和知识服务
的方向发展。数据仓库与数据挖掘技术的引人。对提高水利信息在防洪调度及水资源管理方
面的作用,提高其科学决策能力方面十分必要。
在我国,水文数据由国家设立在全国的3万多处观测站采集,并经过初步的加工整理后存
增水文基本数据,另外每年以300—500MB新增实时水文数据,加上进行水文分析所需的天
气、地理、地质等数据,所需要处理的数据量很大。如何从这些大量、类型复杂的数据中及时准
确地挖掘出满足需要的信息,是水利信息资源开发的关键。
2 系统构架
洪水预报首先要采集大量的水资源信息,建立水资源信息库,并将这些数据整合到数据
仓库中,结合知识库,利用OLAP、数据挖掘等技术,得到洪水预报模型(如图1)。数据要求
如下:
(1)大量的数据源。经过全国数据库建设工作者长达十多年的努力,省(区、流域机构)
的信息量目前已达6000余兆字节,占应入库数据量的80%以上,且大部分省区的入库数据误
码率达到或小于万分之一,在录人数据入库前的校核工作中,不少省区发现和纠正了原水文年
鉴中大量的刊印错误,进一步提高了水文资料的质量。
(2)数据标准化。全国绝大部分省、市、区二级节点选用了中低档微机服务器和SYBASE
移植了基于客户/服务器体系结构的数据检索服务系统。水文数据库主要采用的数据库管理
ASE和MSServer两种。实现信息存储、交换、分析和利用的前提是信息的
系统为srh∞e SQL
标准化,为将来的数据整合做准备。
(3)建立合适的数据组织结构。洪水预报系统对数据有着严格的要求,应尽量描述为数
值或其他可以进行计算的数据,以适应洪水预报分析的需要。
3 系统的数据仓库设计与实现
1998年才发展起来的数据仓库(Data
在国外已是如火如荼了。数据仓库的创始者W.H.Iiunoll认为“数据仓库是为支持管理决策
建立的,面向主题的、综合的、稳定的、随时问变化的数据集合”。数据仓库与传统的数据库系
统相比有着本质的区别,数据库是一种通用平台,建立于严格的数学模型之上,用来管理企业
数据,进行事务处理,完成相关业务。而数据仓库没有严格的数据理论,更偏向于工程,它不是
花钱就可购买到的成品,而是企业日积月累的建立过程,它的应用对象是不同层次的管理者,
它的数据源是多种数据源,库中数据无须修改删除,主要是大规模查询和分析,因此要求有大
量的历史数据和汇总数据。一个典型的数据仓库包括了:源数据部分、数据准备部分、数据存
储部分、信息传递部分。
图1系统构架
3.1 数据仓库组织结构
粒度是对数据仓库中数据的综合程度高低的一个度量,它既影响数据仓库中数据量的多
少,也影响数据仓库所能回答询问的种类,一般来说,粒度越小,数据的细节程度越高,综合程
度越低,回答查询的种类就越多。
58
防洪调度数据仓库中的数据分为四个级别:早期细节级、当前综合级、轻度综合级、高度综
合级。如图2所示。源数据经过综合后,首先进入当前细节级,并根据具体需要进行进一步的
综合从而进入轻度综合级乃至高度综合级。因此,各级数据同时存在是必不可少的。
—{=。高度综台轾
文档评论(0)