- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因数据分析与存储平台建设方案平台建设需求分析平台组成生物信息学研究平台可分为测序平台和分析平台两部分,测序平台以基因测序仪为核心,完成基因测序,获得原始数据;分析平台以高性能计算软硬件系统为核心,完成数据的分析处理,获得分析结果。其中,基因数据存储与分析平台即生物信息高性能计算系统通常包括:计算子系统(刀片节点、胖计算节点、管理登陆节点)存储子系统(在线存储系统、备份存储系统)网络子系统(高速计算存储网络、低速管理网络)管理调度系统(操作系统、集群管理系统、作业调度系统、KVM)基础软件环境(编译器、数学库、并行环境等)应用软件环境(生物信息平台软件、应用软件与基因组数据资源)集群基础设施(机柜、配电系统)机房环境(机房、制冷、监控、消防、隔音、供电等)系统应用分析生命科学做为21世纪最重要的科学分支之一,高性能计算在生命科学的研究和发展中起来非常重要的作用。由于测序技术的飞速发展,人类发现的基因序列数目按照指数级增长,那么对于如此数量庞大的基因进行同源性搜寻,比对,分析,遗传发育分析等等,往往伴随着巨大的数据处理量和并行计算量。同时,由于生命科学的研究对象往往是蛋白质和DNA的大分子,对这些分子的三维结构的预测,动力学特性、热力学特性、在生命过程中如何发生作用,这些科学问题也要借助于高性能计算机。所以高性能计算机在生命科学研究中,应用非常广泛,扮演着及其重要的角色。生物信息学研究平台应用包括测序仪离线处理、序列搜寻比对分析、质谱仪原始资料处理、分子对接(药物设计)、电子显微镜图象处理等等,其中最为主要的仍是测序仪离线处理和序列搜寻比对分析,也是基因数据存储与分析平台承担的主要任务。基因数据存储与分析平台应用的主要特点为:1.计算量大,序列比对等大部分任务在双路节点上可以获得较高的计算效率;2.序列拼接等部分应用需要大内存的节点,部分应用需要单节点1TB以上的内存;3.数据访问量巨大,对存储性能、容量要求高,数据增长速度非常快;4.开源软件众多,安装复杂,需要相应的基因组数据资源;5.部分应用的工作流程较为复杂,自动化较低。系统方案设计系统配置表方案思想:在当前预算下,结合平台应用的特点和对软硬件的需求,搭建符合应用特点的、满足使用需求、并且尽可能完整的基因组分析和存储平台。序号名称技术规格单位数量计算峰值(TFLOPS)存储容量(裸容量TB)功率(kw)高度(U)1硬件部分5.2992965.45171.1计算子系统 刀片平台TC4600E5U机架式刀片机箱,可以支持10个计算刀片;管理模块,集成远程KVM和远程虚拟媒体;千兆网络交换模块,提供6个RJ45千兆接口和2个万兆上联接口;56Gb/s FDR IB网络模块,对外提供10个FDR IB接口;4*电源模块(冗余);台1- -5计算刀片CB60-G202×Intel?Xeon?E5-2640v3 8核处理器?(2.6GHz);128GB?DDR4?2133MHz;1×300G 2.5寸10000转SAS硬盘;1×56Gb?Infiniband端口;2×1000M以太网接口; 片53.328 2.25-四路大内存节点I840-G254U机架式;4×Intel Xeon E7-4850v3 14核处理器?(2.2GHz);?2TB?DDR3 1600MHz内存;?2GB Cache SAS RAID;??2×600GB?SAS 10K热插拔硬盘;2×千兆以太网接口;1×56Gb Infiniband?HCA卡;冗余电源;上架导轨;?台11.9712 1.24管理登录节点I620-G202U机架式;2×Intel?Xeon?E5-2620v3 6核处理器?(2.4GHz);4×8GB?DDR4?2133MHz内存;2×300G 2.5寸10000转SAS硬盘;2×1000M以太网接口;1×56Gb Infiniband?HCA卡;冗余电源;上架导轨;台1- 0.421.2存储子系统 存储节点I640-G154U机架式存储,24盘位,2颗处理器,32GB内存,2*300G 10K SAS系统盘,配置24块4TB SATA数据硬盘,提供96TB存储裸容量;对外配置2个千兆网口、1个FDR IB网口。台1 96141.3网络子系统 计算网络FDR IB 交换机36口FDR Infiniband交换机台1 0.41IB线缆3米FDR Infiniband线缆条8 管理网络 24口千兆交换机 24 个 10/100/1000BASE-T (RJ45)台1- 0.211.4机
文档评论(0)