基于Hadoop的高校大数据平台的设计与实现.pdfVIP

基于Hadoop的高校大数据平台的设计与实现.pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

知识文库第19期

基于Hadoop的高校大数据平台的设计与实现

彭航

本文在对Hadoop平台的结构及功能分析基础上,结合2基于Hadoop的高校大数据平台设计与实现研究

信息化环境下高校系统建设的现状,对基于Hadoop的高校根据上述对Hadoop平台及其结构功能的分析,结合当

大数据平台的设计与实现进行研究,以供参考。前高校信息系统建设与数据管理现状,可构建如下图2所示

在信息化发展影响下,高校信息系统建设与运用也取得的基于Hadoop的高校大数据平台系统,其系统结构主要包

了较为显著的发展,并且在长期的运营与管理中积累了相对括数据源、数据集成、Hadoop平台管理、分布式数据存储、

较多的数据,对高校信息化建设与发展有着十分积极的作用大数据分析、API接口、应用单元等。

和意义。指导注意的是,结合当前高校信息系统建设与发展其中,数据源中包含了高校的各个业务系统、文件系统、

现状,由于其信息系统的分阶段建设,导致在对系统运营及视频监控以及校园论坛等系统数据,主要由结构化和非结构

数据管理中是由多个不同部门分别执行,各数据之间的相互化数据两种形式,其中,结构化数据以Sqlserver和Oracle数

联系与有效交互明显不足。另一方面,在大数据环境下,通据库为数据存储位置,主要以高校各业务系统数据为主;而

过大数据平台的开发设计以实现各信息系统之间的有效对非结构化数据中,部分数据是以blob格式在数据库或者是文

接与信息交互,形成较为统一的数据运营与管理模式,成为件系统中进行存储管理。

各领域信息建设与运营管理研究和关注重点。基于Hadoop的高校大数据平台系统中的数据集成单元,

1Hadoop平台及其结构、功能分析包含了数据采集以及清洗、整合等环节,是数据源中数据提

Hadoop作为一个分布式系统的基础架构,在实际设计与取至Hadoop凭条数据分析的中间结构,其中,该结构单元

开发运用中,是通过Hadoop集群中的一个主控节点对整个在进行数据采集中是通过Sqoop实现关系型数据库数据导向

集群的运行进行控制与管理实现,以满足该集群中多个节点Hadoop平台的HDFS或者是HIVE进行导入。

的数据与计算任务协调需求。其中,分布式文件系统HDFS分布式数据存储结构单元中,进行结构化数据是以表格

以及MapReduce并行化计算框架是Hadoop集群系统的核心,格式在Hadoop平台的Hive中进行存储管理,或者是将数据

HDFS是Hadoop平台中分布式计算下数据存储管理开展基转换成Key-value形式在HBASE中进行存储管理,还可以通

础,具有较为突出的可靠性以及扩展性和高容错性特征;而过文件格式在HDFS中进行存储;而非结构化数据是通过目

MapReduce并行计算框架能够将分析任务分成大量并行Map录与文件组织方式在HDFS中进行存储管理。

和Reduce任务以进行Hadoop平台运行及功能支撑;此外,此外,高校大数据平台系统的大数据分析单元在系统运

HBase是以HDFS为基础的分布式数据库,能够实现海量数行中,通过Hadoop平台进行多种数据处理与分析框架提供,

据存储,而Hive作为数据仓库处理工具,在Hadoop平台运并根据不同应用场景实现合适的数据处理框架和模型选择,

行中主要用于HDFS或者是

文档评论(0)

movie + 关注
实名认证
文档贡献者

喜欢分享的作者

1亿VIP精品文档

相关文档