- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
海洋渔业多维数据仓库构建研究.doc
海洋多维数据仓库构建研究
季民1,靳奉祥1,李婷1,赵相伟1
(1.山东科技大学 测绘科学与工程学院,山东 青岛 266510)
摘要:空间数据仓库的数据集成能力以及对复杂数据分析、高层决策的支持,可为异质异构海洋数据的集成和综合应用提供方法论。以海洋多维数据仓库构建为目标,对维、维层次、海洋多维数据模型等概念进行了形式化描述和定义,并以海洋渔业主题分析为例,对渔业生产的事实、维度、维层次及维层次关系进行识别,并针对时空维的复杂度,以折衷的混合多维数据模型结构对海洋多维数据仓库进行构建。
关键词:数据仓库;多维数据库;海洋渔业;混合模型
中图分类号:TP311;P208 文献标识码:A 文章编号:0253-4193(2009)00-0000-00
1 引言收稿日期:2009-04-10;修订日期:2009-07-22
基金项目:现代工程测量国家测绘局重点实验室开放课题资助项目(TJES0805);国家海洋局海洋溢油鉴别与损害评估技术重点实验室开放基金资助项目(200903);国家“八六三”计划项目(2009AA12Z147);海岛(礁)测绘技术国家测绘局重点实验室资助项目(2009B14)。
作者简介:季民(1970-),男,山东省齐河县人,山东科技大学副教授,博士,从事空间数据组织与GIS系统集成研究。
Email: jimin@, jamesjimin@
人们在长期的海洋观测和渔业生产过程中积累了丰富的海洋数据和渔业生产统计数据,这些数据是人类认识海洋、揭示鱼群洄游规律的重要数据来源,但现有的数据均以不同的格式、不同的尺度、不同的空间基准存储在不同的专题数据集中,从而在不同程度上限制和阻碍了海洋数据的综合应用及海洋知识发现的过程。为了更好地适应当今社会对各级尺度下海洋问题的研究,需要有一个统一的信息视图将大量历史的、现实的海洋数据按照相应的研究主题转换成统一的格式,从而实现异质异构数据的集成、存储和管理。空间数据仓库的数据集成能力以及对复杂数据分析、高层决策的支持,为该问题的解决提供了方法论[1]。
要构建海洋空间数据仓库,需要根据面向的海洋主题问题,通过元数据驱动机制,将异质异构的海洋数据经过清洗、抽取和变换,以多维方式组织在仓库的综合数据集中;在具体的分析过程中,可按照主题问题,将任一维与其它维进行组合,以多维方式显示数据,供人们从不同角度、多方位地认识复杂的海洋世界。对海洋多维数据仓库的构建并没有一种现成的或万能的建模方法,本文在总结多维数据库相关概念的基础上,对海洋多维数据模型进行了形式化定义,并以海洋渔业主题分析为例,进行了事实、维度及维层次的识别,并构建了以混合模型为主的海洋多维数据仓库。
2 多维数据库基本概念
2.1 数据立方体
数据立方体(data cube)是多维数据仓库中数据组织和存储的重要手段[2],它采用多维立体数据存储方式来取代传统的平面数据存储方式,为进行多维数据分析提供根本保证。在理论上立方体可以具有n维。图1中的每一三维立方体直观地反映了渔获量在三个维度(渔业公司、渔区、渔种)上的变化和对比。若增加第四维——时间维,则可将其看作三维结构的立方体随时间维的变化序列。按照这样的组织方式,可以把任何n维数据的显示看成是一个n-1维“立方体”的序列。
2.2 维
在多维数据库中,维是一个必要而又与众不同的概念[2]。多维数据模型的一个主要目标就是利用维为事实的访问提供尽可能多的途径,每一维代表一个统一的访问数据仓库的信息路径。
2.3 维层次
在实际中数据立方体的维常常具有多个属性,这些属性可按细节程度组织成层次形式[3],例如时间维层次为日、周、月、季、年。维层次能清楚地体现下钻和上钻操作。对象间的层次关系可抽象为三类[4]:特化/泛化关系、聚集关系以及成员关系。无论维层次结构中的哪种关系,低维层所对应的现实世界中的对象在逻辑上都包含于(或“小于”)高维层所对应的对象[5]。
9月
渔种
渔
业
公
司
渔场
渔业生产渔获量
10月
11月
渔场
渔场
图1 渔业生产渔获量四维立方体表达
2.4 维成员
维的一个取值称为该维的一个成员,若维是多层次的,则维成员是在不同维层次的取值的组合[6]-[7],例如时间维具有日、月、年三个层次,分别在日、月、年上取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日”。
2.5 事实
在海洋渔业领域,事实代表着要进行分析的且我们感兴趣的模式或事件,在大多数多维数据模型中,事实被其组合在一起的维值所隐式定义,只有当特定维值的组合没有造成空穴时,一个事实才会存在,然而有些模型将事实看成具有独特个性的一级对象。大多数多维模型也要求将每一事实与每一维最低级别的一个维值建立联系,但有些模型放宽了这种要求。每一事实都有一定的粒度,该粒度是
文档评论(0)