大数据平台解决方案报告书(1).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据平台技术方案 1. 大数据平台技术方案 ........................................ 3 技术路线 3 动静态信息交换 4 系统概述 4 数据采集服务 4 数据采集服务配置 5 平台认证服务 5 动静态数据发布订阅服务 5 负载均衡服务 6 协议分析转换功能 6 动静态数据分发服务 6 数据分发服务配置 6 数据缓存服务 7 数据交换信息日志 7 大数据存储 7 数据仓库工具 8 大数据在线存储 8 大数据离线存储 10 数据清洗转换 12 流数据处理框架 12 分布式ETL工具 12 ETL功能介绍 13 大数据处理 15 实时数据流处理 15 数据挖掘分析引擎 15 大数据服务引擎 16 大数据配置服务管理 16 大数据在线分析 16 大数据离线分析 17 大数据可视化管理 20 大数据全文检索 21 调度与业务监控 21 资源与安全 22 租户管理 22 资源分配 23 权限管理 23 接口封装 23 大数据平台技术方案 概述 大数据平台必须具有高度可扩展性、实时性、高性能、低延迟分析、高度容错性、可用性、支持异构环境、开放性、易用性,同时也希望具有较低成本;其核心技术包括大规模数据流处理技术以及大规模数据管理、分析技术。 系统技术架构采用面向服务的体系结构( Service-Oriented Architecture, SOA),遵循分层原则,每一层为上层提供服务。将大数据平台进行逐层解析,从下至上分别是数据接口层、文件存储层、数据存储层、数据分析层、数据层、业务控制层、表现层、系统监控层。 数据接口层: 为保证数据接入层的接口灵活性, 采用 Restful 风格接口实现方式, Restful 有轻量级以及通过 HTTP 直接传输数据的特性, Web 服务的 RESTful 方法已经成为最常见的方法。同时数据的接入及交换采用 Kafka 集群和 WebService 方式, Kafka 是一种高吞吐量的 分布式发布订阅消息系统, 可以满足系统与大数据平台的高并发量数据交换。 Web Service 是一个平台独立的,低耦合的,自包含的、基于可编程的 web的应用程序,可使用开放的 XM 标准来描述、发布、发现、协调和配置这些应用程序,用于开发分布式的互操 作的应用程序。 文件存储层:为满足大数据的存储要求,文件存储采用 HDFS文件系统,Hadoop分布式文件系统 (HDFS)是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问, 非常适合大规模数据集上的应用。 数据存储层: 根据本工程数据资源设计的需要, 数据存储分别采用关 系数据库、存数据库 Redis 、分布式大数据存储。 数据分析层:采用 Storm 技术完成实时流分析的需求, Storm 是一个分布式的、容错的实时计算系统。可以方便地在一个计算机集群中编写与扩展 复杂的实时计。采用 MapReduce和 Spark 实现离线分析。 Spark 是类 Hadoop MapReduce的通用并行框架,能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce的算法。 数据接入层: 应用与数据库的交互采用 JDBC级 Hibernate 技术实现。 Hibernate 是一个开放源代码的对象关系映射框架, 它对 JDBC进行了非常轻量级的对象封装,它将 POJO与数据库表建立映射关系,是一个全自动的 orm 框架,hibernate 可以自动生成 SQL语句,自动执行,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。 业务控制层:采用当今最流行的轻量级 Java 开发框架 Spring ,同时与 SpringMVC整合。 Spring 具有轻量、低侵入式设计、方便解耦,简化开发、AOP编程的支持、方便集成各种优秀框架等优点。 表现层:采用 EasyUI,Ajax ,FreeMarker ,JavaScript 技术,这些技术能极大提高开发效率,同时能满足工程中各种复杂的前端展现要求。 监控层:采用 Zookeeper 分布式服务框架。主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。它的作用主要是用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。 动静态信息交换 系统概述 动静态信息交换建立目的是通过标准的规性数据接口定义,实现采集各类动态和静态数据,实现与接入平台的数据通信与交换共享。 数据采集交换系统根据数据交换的对象和容的不同,服务对象包括省市级管理机构等。数据交换平台包含一系列的服务,如:数据采集服务、平台认证服 务、发布订阅服务等

文档评论(0)

文档查询,农业合作 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体土默特左旗农特农机经销部
IP属地广西
统一社会信用代码/组织机构代码
92150121MA0R6LAH4P

1亿VIP精品文档

相关文档