- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库系统的技术体系架构设计,数据仓库体系架构,数据仓库系统架构,数据仓库技术架构,数据仓库架构,数据仓库体系结构,数据仓库架构师,数据仓库架构图,数据仓库架构设计,数据仓库系统
数据仓库系统的技术体系架构设计
作者:成晓旭
QQ:1182321168
该数据仓库系统的主要功能是从众多外部系统中,采集相关的业务数据,集
中存储到系统的数据库中。系统内部对所有的原始数据通过一系列处理转换之
后,存储到数据仓库的基础库中;然后,通过业务需要进行一系列的数据转换到
相应的数据集市,供其他上层数据应用组件进行专题分析。
【概述】
因此,从数据被采集、转换、存储、分析、应用的角度对系统内部技术构件
进行抽象,将系统内部分为采集层、数据处理层、业务应用层、配置层 4 个逻
辑层次。数据分析系统的技术体系架构如下图:
【采集层】
在采集层,主要应用接口适配器、网络文件采集及转换器、ESB 总线等技
术。
接口适配器技术,用于适配各专业系统的数据采集接口,通过接口适配器来
屏蔽各专业接口方式的差异性;
网络文件采集及转换器,用于从各专业系统的采集文件数据,主要针对特定
格式的各类网络数据文件,负责对数据格式进行格式化、规范化等预处理;
ESB 总线对标准的 WebService/JMS 接口方式的数据进行采集。
【数据处理层】
在处理层,主要应用数据持久化、J2EE、BI 等技术。
数据持久化主要采用关系数据库技术和文件数据库技术。关系数据库技术,
用于存储系统采集、处理、计算等业务数据,存储系统各类运行参数配置信息,
以及其他的运行过程信息;文件服务器,为各类文件型数据提供数据存储和访问
服务;
J2EE 技术,是系统中所有 B/S 逻辑构件、应用程序、Web 服务的容器,为
各种 B/S 组件提供运行环境,并对其生命周期进行管控;
BI 的元数据管理为各类动态统计分析报表的数据聚合、多维分析、数据加载、
数据生产、数据项、计算规则、展示方式等提供配置管理。
【应用层】
在应用层,用于人机交互的主要应用 BI、Web 等技术。
Web 技术,提供系统的 B/S 界面的应用,包括 HTML、CSS、JS、Ajax 等;
BI 技术,为各类动态统计分析结果提供报表、图形、仪表盘等丰富的展示方
式;用于系统交互的 ESB 总线技术,以数据总线的方式发布 WebService 调用、
或者下发 JMS 数据,通过统一的数据发布系统为外部系统提供服务数据共享服
务。采用第三方标准中间件产品来实现,例如:SAP 的 BOE (BusinessObjects
Enterprise)、IBM 的 Cognos、MSTR 的 MicroStrategy 等主流的 BI 中间件产
品。
【配置层】
在配置层,主要应用 ETL 可视化可配置平台、规则引擎、工作流引擎等技术。
ETL 可视化配置技术,用于提供可视化、可配置的 ETL 数据抽取、转换、
加载的处理,主要针对数据库数据、FTP 标准文件格式的数据或者经过网络文
件采集及转换器预处理过的中间数据;
规则引擎部分为采集成各类适配及采集器提供配置数据的集中管理,包括提
供接口文件的采集目录、文件名规则、数据项约定以及 ETL 数据抽取规则等的
配置管理;
工作流引擎,提供从数据采集接口配置、采集数据项、ETL 参数配置、指标
关联映射、BI 参数关联映射等全过程的流程化配置向导。
文档评论(0)