- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因数据分析与存储平台
建设方案
目录
TOC \o 1-3 \h \z \u 1 平台建设需求分析 3
1.1 平台组成 3
1.2 系统应用分析 4
2 系统方案设计 7
2.1 系统配置表 7
2.2 系统拓扑图 10
2.3 系统方案说明 11
3 系统技术参数 12
3.1 总体指标 12
3.2 刀片机箱 12
3.3 计算刀片 12
3.4 四路节点 12
3.5 管理登录节点 12
3.6 存储节点 13
3.7 集群网络 13
3.8 机柜配电 13
3.9 集群软件 13
3.10 系统集成实施与售后服务 15
平台建设需求分析
平台组成
生物信息学研究平台可分为测序平台和分析平台两部分,测序平台以基因测序仪为核心,完成基因测序,获得原始数据;分析平台以高性能计算软硬件系统为核心,完成数据的分析处理,获得分析结果。
其中,基因数据存储与分析平台即生物信息高性能计算系统通常包括:
计算子系统(刀片节点、胖计算节点、管理登陆节点)
存储子系统(在线存储系统、备份存储系统)
网络子系统(高速计算存储网络、低速管理网络)
管理调度系统(操作系统、集群管理系统、作业调度系统、KVM)
基础软件环境(编译器、数学库、并行环境等)
应用软件环境(生物信息平台软件、应用软件与基因组数据资源)
集群基础设施(机柜、配电系统)
机房环境(机房、制冷、监控、消防、隔音、供电等)
系统应用分析
生命科学做为21世纪最重要的科学分支之一,高性能计算在生命科学的研究和发展中起来非常重要的作用。由于测序技术的飞速发展,人类发现的基因序列数目按照指数级增长,那么对于如此数量庞大的基因进行同源性搜寻,比对,分析,遗传发育分析等等,往往伴随着巨大的数据处理量和并行计算量。同时,由于生命科学的研究对象往往是蛋白质和DNA的大分子,对这些分子的三维结构的预测,动力学特性、热力学特性、在生命过程中如何发生作用,这些科学问题也要借助于高性能计算机。所以高性能计算机在生命科学研究中,应用非常广泛,扮演着及其重要的角色。
生物信息学研究平台应用包括测序仪离线处理、序列搜寻比对分析、质谱仪原始资料处理、分子对接(药物设计)、电子显微镜图象处理等等,其中最为主要的仍是测序仪离线处理和序列搜寻比对分析,也是基因数据存储与分析平台承担的主要任务。
基因数据存储与分析平台应用的主要特点为:
1.计算量大,序列比对等大部分任务在双路节点上可以获得较高的计算效率;
2.序列拼接等部分应用需要大内存的节点,部分应用需要单节点1TB以上的内存;
3.数据访问量巨大,对存储性能、容量要求高,数据增长速度非常快;
4.开源软件众多,安装复杂,需要相应的基因组数据资源;
5.部分应用的工作流程较为复杂,自动化较低。
系统方案设计
系统配置表
方案思想:在当前预算下,结合平台应用的特点和对软硬件的需求,搭建符合应用特点的、满足使用需求、并且尽可能完整的基因组分析和存储平台。
序号
名称
技术规格
单位
数量
计算峰值(TFLOPS)
存储容量(裸容量TB)
功率(kw)
高度(U)
1
硬件部分
5.2992
96
5.45
17
1.1
计算子系统
刀片平台
TC4600E
5U机架式刀片机箱,可以支持10个计算刀片;管理模块,集成远程KVM和远程虚拟媒体;千兆网络交换模块,提供6个RJ45千兆接口和2个万兆上联接口;56Gb/s FDR IB网络模块,对外提供10个FDR IB接口;4*电源模块(冗余);
台
1
-
-
5
计算刀片
CB60-G20
2×Intel?Xeon?E5-2640v3 8核处理器?(2.6GHz);128GB?DDR4?2133MHz;1×300G 2.5寸10000转SAS硬盘;1×56Gb?Infiniband端口;2×1000M以太网接口;
片
5
3.328
2.25
-
四路大内存节点
I840-G25
4U机架式;4×Intel Xeon E7-4850v3 14核处理器?(2.2GHz);?2TB?DDR3 1600MHz内存;?
2GB Cache SAS RAID;??2×600GB?SAS 10K热插拔硬盘;2×千兆以太网接口;1×56Gb Infiniband?HCA卡;冗余电源;上架导轨;?
台
1
1.9712
1.2
4
管理登录节点
I620-G20
原创力文档


文档评论(0)