- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
系统设计说明书模版.doc
大数据ETL管理项目概要设计说明书
总 NUMPAGES 15页,第 PAGE 15页
概要设计说明书编写指南
总 NUMPAGES 8页,第 PAGE 1页
《大数据ETL管理项目》
概要设计说明书
二〇一六年八月
舜宇光学科技(集团)有限公司
目 录
目录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc474310895 1. 概述 PAGEREF _Toc474310895 \h 2
HYPERLINK \l _Toc474310896 2. 系统简介 PAGEREF _Toc474310896 \h 2
HYPERLINK \l _Toc474310897 2.1 系统目标 PAGEREF _Toc474310897 \h 2
HYPERLINK \l _Toc474310898 2.2 系统设计原则 PAGEREF _Toc474310898 \h 3
HYPERLINK \l _Toc474310899 2.3 系统运行环境 PAGEREF _Toc474310899 \h 3
HYPERLINK \l _Toc474310900 3. 总体结构 PAGEREF _Toc474310900 \h 3
HYPERLINK \l _Toc474310901 4.系统模块设计 PAGEREF _Toc474310901 \h 5
HYPERLINK \l _Toc474310902 4.1子系统模块结构图 PAGEREF _Toc474310902 \h 5
HYPERLINK \l _Toc474310903 4.2子系统模块概要设计 PAGEREF _Toc474310903 \h 7
HYPERLINK \l _Toc474310904 5.数据库设计 PAGEREF _Toc474310904 \h 8
HYPERLINK \l _Toc474310905 5.1 同步配置表设计 PAGEREF _Toc474310905 \h 8
HYPERLINK \l _Toc474310906 5.2 统计分析结果表设计 PAGEREF _Toc474310906 \h 10
概述
系统简介
本系统有以下四大块:ORACLE-GP同步模块,HBASE-HIVE同步模块,HBASE-GP同步模块,数据定时抽取统计分析模块。
系统目标
随着集团信息化的发展,数据库种类也越来越多,有oracle、hbase、hive、greenplum等数据库,如何解决各个数据库之间数据同步交互,保障各种分析报表统计正确,成为了亟待解决的一个难题。本系统的设计就是为了解决各系统数据同步问题,以及抽取计算原始数据,保障分析报表平稳运行。
系统设计原则
根据用户需求,需要同步的数据具有时效性:有些数据可以每天同步,但有些数据必须每小时同步。这样,设计的同步方案需要对同步数据进行合理预估,保证数据在一个小时之内同步完成。
同时,数据定时抽取统计分析模块也要根据报表需求,在不同时间段进行抽取统计。
系统运行环境
硬件环境:
模块硬件配置(内存,硬盘)操作系统ORACLE-GP同步模块256G,13TCentos6.5HBASE-HIVE同步模块128G, 8Tcentos7HBASE-GP同步模块256G,13TCentos6.5抽取统计模块8G,200Gcentos7软件支持:
模块编程语言/工具命令运行平台ORACLE-GP同步模块bash,sqluldr2,gploadKETTLEHBASE-HIVE同步模块bash,pig,hdfsKETTLEHBASE-GP同步模块bash,pig,gploadKETTLE抽取统计模块java,sping定时器TOMCAT
总体结构
系统拓扑结构图,如下图,涉及到的同步有三个过程,即三个同步模块:ORACLE-GP同步模块,HBASE-HIVE同步模块,HBASE-GP同步模块。统计抽取模块会对oracle、mysql、hbase、hive、greenplum数据库进行数据抽取统计分析,并且将统计结果回传至oracle保存。
4.系统模块设计
4.1子系统模块结构图
4.1.1 ORACLE-GP同步模块
3.1.2 HBASE-HIVE同步模块
4.1.3 HBASE-GP同步模块
4.1.4抽取统计模块
4.2子系统模块概要设计
您可能关注的文档
最近下载
- pep人教版六年级上学期英语全学期课时作业练习题.doc VIP
- 电气控制与PLC教案.pdf VIP
- NBT20277-2014 A240(S32101)双相不锈钢焊接规范.pdf VIP
- 2025秋人教版(PEP)(2024)三年级上册英语教学计划.docx VIP
- 初一英语文化课件.pptx VIP
- 高标准农田监理大纲方案投标文件(技术方案).doc
- 第一单元 第1课《可爱的我们》核心素养教学设计 2025湘美版美术三年级上册.pdf
- 2025云南省中职职教高考职业技能考烹饪类专业理论测试模拟05.doc VIP
- 客服人员心态与沟通技巧培训PPT.pptx VIP
- 农村公共卫生与健康促进.pptx VIP
文档评论(0)