- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高校大数据平台设计与实践
王永坤
上海交通大学网络信息中心
数据平台
数据的导入、存储、处理、分析、共享于一体的软
件和硬件平台。
数据平台现状– 百花齐放
硬件
• 厂商提供可定制的硬件以及参考配置
• Open Compute Project也提供大公司等的硬件设计
软件
• 丰富的开源解决方案,Hadoop,Spark,……
• 活跃的开源社区
平台方案
• 企业平台提供商:Cloudera,Hortonworks,星环等
云方案
• AWS, Google Cloud Big Data Products, Microsoft Azure
Hadoop
• 阿里云大数据服务ODPS 、天池、及数加;腾讯大数据;百度大
数据+
已有数据平台的挑战
成本
配置灵活性
知识产权问题
数据共享安全问题
我们的目标
完全使用开源解决方案
• 成本
• 维护
依托高校
• 智力资源多
• 成本低
• 创新性好
存储、计算、和代码
• 减少数据和代码的移动
数据平台架构
) 多功能用户接口 实时报表
a
k
f
a
K
( 数据分析
据
数 数据科学
化
构 认证及访问控制
结
非
高可用文件系统 高可用调度系统
擎 L 库 监控
HDFS HA 主 引 Q 仓
) S
p 索 o 码
o 主 备 YARN HA N
o 搜 代
q 备
S
(
据
数
化 高存储 标准
构
结 服务器 机柜
数据平台硬件
一期:CPU :512核;内存:~3TB ;存储:~1PB;网络:
2*10Gbps;配置和运维:我自己
二期:约20-30倍扩容,~30PB
服务器(2U)配置
CPU 2个Intel Xeon E5-2640v3 8核16线程
内存 256GB DDR4
4块Intel 480GB DC S3510 SSD
控制节点
(RAID10)
存储 计算存储 12块12Gbps SAS 6TB硬盘
节点 (JBOD)
2块2.5寸SAS 10K 600GB (OS)
2个万兆(10G)SFP+(链路聚合为20G)
网络 2个千兆(1G)RJ45 (远程控制)
IPMI 口
原创力文档


文档评论(0)