高校大数据平台设计和实践.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高校大数据平台设计与实践 王永坤 上海交通大学网络信息中心 数据平台 数据的导入、存储、处理、分析、共享于一体的软 件和硬件平台。 数据平台现状– 百花齐放 硬件 • 厂商提供可定制的硬件以及参考配置 • Open Compute Project也提供大公司等的硬件设计 软件 • 丰富的开源解决方案,Hadoop,Spark,…… • 活跃的开源社区 平台方案 • 企业平台提供商:Cloudera,Hortonworks,星环等 云方案 • AWS, Google Cloud Big Data Products, Microsoft Azure Hadoop • 阿里云大数据服务ODPS 、天池、及数加;腾讯大数据;百度大 数据+ 已有数据平台的挑战 成本 配置灵活性 知识产权问题 数据共享安全问题 我们的目标 完全使用开源解决方案 • 成本 • 维护 依托高校 • 智力资源多 • 成本低 • 创新性好 存储、计算、和代码 • 减少数据和代码的移动 数据平台架构 ) 多功能用户接口 实时报表 a k f a K ( 数据分析 据 数 数据科学 化 构 认证及访问控制 结 非 高可用文件系统 高可用调度系统 擎 L 库 监控 HDFS HA 主 引 Q 仓 ) S p 索 o 码 o 主 备 YARN HA N o 搜 代 q 备 S ( 据 数 化 高存储 标准 构 结 服务器 机柜 数据平台硬件 一期:CPU :512核;内存:~3TB ;存储:~1PB;网络: 2*10Gbps;配置和运维:我自己  二期:约20-30倍扩容,~30PB 服务器(2U)配置 CPU 2个Intel Xeon E5-2640v3 8核16线程 内存 256GB DDR4 4块Intel 480GB DC S3510 SSD 控制节点 (RAID10) 存储 计算存储 12块12Gbps SAS 6TB硬盘 节点 (JBOD) 2块2.5寸SAS 10K 600GB (OS) 2个万兆(10G)SFP+(链路聚合为20G) 网络 2个千兆(1G)RJ45 (远程控制) IPMI 口

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档