- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因数据分析与存储平台
建设方案
目录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc430713748 1 平台建设需求分析 PAGEREF _Toc430713748 \h 3
HYPERLINK \l _Toc430713749 1.1 平台组成 PAGEREF _Toc430713749 \h 3
HYPERLINK \l _Toc430713750 1.2 系统应用分析 PAGEREF _Toc430713750 \h 4
HYPERLINK \l _Toc430713751 2 系统方案设计 PAGEREF _Toc430713751 \h 7
HYPERLINK \l _Toc430713752 2.1 系统配置表 PAGEREF _Toc430713752 \h 7
HYPERLINK \l _Toc430713753 2.2 系统拓扑图 PAGEREF _Toc430713753 \h 10
HYPERLINK \l _Toc430713754 2.3 系统方案说明 PAGEREF _Toc430713754 \h 11
HYPERLINK \l _Toc430713755 3 系统技术参数 PAGEREF _Toc430713755 \h 12
HYPERLINK \l _Toc430713756 3.1 总体指标 PAGEREF _Toc430713756 \h 12
HYPERLINK \l _Toc430713757 3.2 刀片机箱 PAGEREF _Toc430713757 \h 12
HYPERLINK \l _Toc430713758 3.3 计算刀片 PAGEREF _Toc430713758 \h 12
HYPERLINK \l _Toc430713759 3.4 四路节点 PAGEREF _Toc430713759 \h 12
HYPERLINK \l _Toc430713760 3.5 管理登录节点 PAGEREF _Toc430713760 \h 12
HYPERLINK \l _Toc430713761 3.6 存储节点 PAGEREF _Toc430713761 \h 13
HYPERLINK \l _Toc430713762 3.7 集群网络 PAGEREF _Toc430713762 \h 13
HYPERLINK \l _Toc430713763 3.8 机柜配电 PAGEREF _Toc430713763 \h 13
HYPERLINK \l _Toc430713764 3.9 集群软件 PAGEREF _Toc430713764 \h 13
HYPERLINK \l _Toc430713765 3.10 系统集成实施与售后服务 PAGEREF _Toc430713765 \h 15
平台建设需求分析
平台组成
生物信息学研究平台可分为测序平台和分析平台两部分,测序平台以基因测序仪为核心,完成基因测序,获得原始数据;分析平台以高性能计算软硬件系统为核心,完成数据的分析处理,获得分析结果。
其中,基因数据存储与分析平台即生物信息高性能计算系统通常包括:
计算子系统(刀片节点、胖计算节点、管理登陆节点)
存储子系统(在线存储系统、备份存储系统)
网络子系统(高速计算存储网络、低速管理网络)
管理调度系统(操作系统、集群管理系统、作业调度系统、KVM)
基础软件环境(编译器、数学库、并行环境等)
应用软件环境(生物信息平台软件、应用软件与基因组数据资源)
集群基础设施(机柜、配电系统)
机房环境(机房、制冷、监控、消防、隔音、供电等)
系统应用分析
生命科学做为21世纪最重要的科学分支之一,高性能计算在生命科学的研究和发展中起来非常重要的作用。由于测序技术的飞速发展,人类发现的基因序列数目按照指数级增长,那么对于如此数量庞大的基因进行同源性搜寻,比对,分析,遗传发育分析等等,往往伴随着巨大的数据处理量和并行计算量。同时,由于生命科学的研究对象往往是蛋白质和DNA的大分子,对这些分子的三维结构的预测,动力学特性、热力学特性、在生命过程中如何发生作用,这些科学问题也要借助于高性能计算机。所以高性能计算机在生命科学研究中,应用非常广泛,扮演着及其重要的角色。
生物信息学研究平台应用包括测序仪离线处理、序列搜寻比对分析、质谱仪原始资料处理、分子对接(药
文档评论(0)