- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HADOOP的高能物理分析平台
孙功星
高能物理研究所/计算中心
2013-07-05
HEP Experiment(International)
CMS experiment as a example.
Raw data sent to online farm.(1PB/s)
Physics Data: 1.5MB @ 150Hz=225MB/s (-tape)
Alignment and Calibration Data: 100MB/s
LHC runs for 10 million of seconds/year.
3PB/year.
Life time 20 years: 60PB. Atlas is same as CMS.
150PB for all 4 Experiments on LHC
高能物理实验(国内)
国内的BESIII实验为例。
北京正负对撞机从2009年运行,产生了大量数据。
产生的数据量约3PB。
物理分析的数据约1/10,即300TB,10亿个事例(event)。
特点:数据量大、物理事例无关,同时属于“大海捞针”。
IHEP Computing Environment Architecture
10Gb Ethernet
(computing. Storage
Network)
1GE
1GE
1GE
IHEP
Campus Network
CNIC
10Gbps
10Gbps
10Gbps
10Gbps
1Gbps
Disk Servers
CPU servers
ON-line farm
FC
TPservers
10Gbps
Login Servers
Home Dirs(AFS)
+Monitoring
+Scheduler
Tape Lib.
Computing Storage Facilities at IHEP
2 Tape Libraries(5PB)柜
Computing Cluster(+10000cores)
Central shift room
Disk storage(4PB)
180X10Gb ports
core switch
造价不菲!
计算技术发展
主机时代:打孔—操作系统。
专用连接时代:MPP。
以太网时代:Cluster计算/PC-FARM。
广域互联时代:网格计算。
强PC时代:强处理能力、大内存、大磁盘容量。如何利用?
PC时代:先进的数据处理框架
键-值对(Key,value):扩展性好、并发性高、速度快。存储:PB-EB。
索引:分布式、稀疏的、高并发、列查询。
更多优势:便宜、高效。
1991年伯克利内存数据库:一个内存(key,value)应用。
计算模式改变
传统集群:数据—计算;
Hadoop集群:计算—数据。
后果:
- 充分利用本地资源;
- 减少了I/O的压力;
- 减少系统造价;
- 提高性能。
搜索引擎:Google
GFS(Google File System)。
BigTable:打破了传统数据库的局限,使非SQL数据库成研究热点
MAP/Reduce并行处理框架。
PageRank:对网页重要性评估的算法。
极强创新群体,工程师大都是自然科学博士。微软大都是本科生。
2003年开始发表论文,介绍研究及应用成果。
Larry Page(1973),
身价198亿美元。密执安州立大学博士
Sergey Brin(1973),
身价198亿美元。斯坦福大学博士
开源项目:Hadoop
组件:HDFS、HBASE、Mapreduce ….。(2005年)
Examples
Yahoo:
40,000 nodes,100,000 cores
The largest cluster has 4500 nodes
Facebook:two hadoop clusters
1100 nodes, 8800 cores, ~12PB disk space
300 nodes, 2400 cores, ~3PB disk space
Each node has 8 cores, 12TB disk space
Baidu (year 2011):
10,000 nodes
Customized nodes based on Intel framework, each node cost 3K-5K USD, with 12*1TB disks, 32GB memory
10
高能物理与Hadoop
Bioinformatics, weather prediction, astronomical image processing, …
High Energy Physics
7 CMS sit
您可能关注的文档
最近下载
- 外教社新编日语(重排本)第2册 PPT课件 unit 8.pptx VIP
- 【新教材】2025-2026学年统编版(2024)道德与法治三年级上册全册基础知识梳理.pdf VIP
- PLC变频控制恒压供水系统模拟.doc VIP
- 水利水电工程施工现场管理人员(质检员岗位)培训考试【试卷B】.docx
- 工程经济学第4版于立君课后参考答案.docx VIP
- 《短视频与直播电商》全套教学课件.pptx
- 初中心理健康 与压力共舞 课件 (共20张PPT).pptx VIP
- DG_TJ08-40-2010:地基处理技术规范.pdf VIP
- 通桥(2021)5402-05客货共线铁路钢筋混凝土框架箱涵 单孔 孔径:3.0m.pdf
- 古代汉语-自考00536.doc VIP
文档评论(0)