- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据分析平台一期硬件配置(续) ? 光前交换机配置要求 ? ? ? 千兆端口: 278 万兆端口: 100 带宽: 8GB 总存储容量: 40TB ? NAS 集群配置如下: ? ? ? ? ? ? 磁盘: 15000 RPM SAS Disks 网络接口:万兆 网络传输协议: TCP/IP 网络文件协议: CIFS 、 NFS 单台 Cache : 8GB 大数据分析平台一期软件清单 类型 基础计算平台 历史归档查询平台 沙盘演练平台 软件清单 Hadoop 0.2 类型 管理分析平台 数据 集市服务器 ? Centos 6.3 软件清单 Centos 6.3 Hadoop 0.2 Centos 6.3 Hadoop 0.2 Centos 6.3 Hadoop ClientHive Centos 6.3 TaskAutomation MySQL Client 实时分析平台 内存 数据库服务器 SAP Hana Enterprise 1.0 Centos 6.3 MicroStrategy 9.3 管理分析 实时分析 Hana Client 平台 BI 应用服务器 DB Client Centos 6.3 数据交换平台 流程调度 ETL 平台 Perl Runtime MySQL DBD Centos 6.3 管理分析 实时分析 Tomcat 7.0 平台 WEB 服务器 Centos 6.3 目 录 1 XX 保险大数据分析平台综述 2 3 大数据分析平台总体架构 大数据分析平台演进路线 4 5 大数据分析平台一期实施重点 附录:数据质量管理平台 数据质量管理平台技术架构 数据质量管理系统元模型包含检查规则、 检查执行结果、分析报告,模型作为一个 独立的 Schema 部署在决策分析报表平台的 数据库 数据质量检查规则配置模块作为 Java Web 应用部署在金融数据平台 Tomcat 集群上,数据质量管理员通过统一的 Web 服务访问,实现检查规则的维护 ? ? 数据质量管 理平台以元 信息模型为 核心,由规 则配置管理 模块、检查 执行模块、 分析报告生 成模块和分 析报告展现 模块四部分 构成。 整个数据质 量检查过程 以 ETL 任务的 形式统一调 度执行。 数据质量检查规则执行模块作为多个 ETL 任 务部署在金融数据平台 ETL 服务器上,由 Automation 工作流调度服务统一调度运行, 实现各个数据区技术和业务数据质量检查 数据质量分析报告展现模块作为 Java Web 应用部署在金融数据平台 Tomcat 集群上,用户通过统一的 Web 服务访问, 实现日报、月报的浏览、下载等功能 数据质量分析报告生成模块作为一个 ETL 任 务部署在决策分析报表平台 ETL 服务器上, 由 Automation 工作流调度服务统一调度运 行,按照每日、每月生成各数据区数据质 量检查报告 数据质量检查执行服务 ? ? ? ? 数据质量管理 的规则执行服 务作为 ETL 任 务部署在 ETL 服务器上 在整个数据处 理过程中,设 置 4 类检查点 在不同的检查 点由 Task Automation 工 作流统一调度 执行 检查结果统一 存入数据质量 管理资料库 1 2 3 4 检查规则执行服务检查点 1 云数据推送平台接口文件级规范性检查任务说明 任务类型 ETL 阶段 执行频率 执行方式 检查对象 检查内容 实现技术 成功阈值 依赖任务 触发任务 ETL 任务 —— 技术型检查 云数据推送平台 - 金融数据交换平台 NAS 存储指定目录 每日执行 由 Task Automation 工作流引擎根据工作流定义统一调度,在 ETL 服务器上执行 云数据推送平台按照接口规范导出的业务系统每日增量数据文件和控制文件 接口文件是否存在,接口文件名称是否正确,接口文件是否通过 MD5 校验 Linux 脚本语言, Perl 或 Python 所有规则通过检查 N/A 数据加载 检查规则执行服务检查点 2 临时区数据技术性检查任务说明 任务类型 ETL 阶段 执行频率 执行方式 检查对象 检查内容 实现技术 成功阈值 异常处理 ETL 任务 —— 技术型检查 临时数据区 - 贴源整合数据区 每日执行 由 T
您可能关注的文档
最近下载
- 电力行业电网运行维护员岗面试真题题库参考答案和答题要点.docx VIP
- 健康照护师复习资料试题附答案(500题).docx
- 2型糖尿病医学演示课件.ppt VIP
- 2024新沪教版英语(五·四学制)七年级上单词表 (英译汉).docx VIP
- (2025年版)基孔肯雅热诊疗方案全文PPT课件.ppt
- 浙江绍兴市12345政务热线招录工作人员6人笔试备考题库带答案详解.docx VIP
- 化学丨河北省石家庄市2024届高三下学期3月联考(一模)化学试卷及答案.pdf VIP
- SHT35212007石油化工仪表工程施工技术规程.pdf VIP
- 心力衰竭课件PPT.pptx VIP
- NFPA 72-2022 国家火灾报警和信号代码(中文翻译版).pdf VIP
文档评论(0)