深度学习DeepNEX方案简述-RTHPC.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2017 DeepNEX 方案简述 DEEPNEX 深度学习平台方案介绍 联想集团 联想创投集团 | 上海 香港 1 DEEPNEX 功能介绍 DeepNEX 是面向深度学习用户,提供易管理、支持多种部署模式、支持超参数 自动搜索优化的 深度学习平台。 DeepNEX 是高效的中央资源管理软件,具有以 GPU 为单位对用户的资源进行调度功 能。深度学习用户可以根据需求 ,通过部署 DeepNEX ,在深度学习硬件平台实现进行资源的申 请(包括运行环境、处理器核数、内存、GPU 数量)等功能。 DeepNEX 平台通过系统统筹管理 GPU 资源,根据用户的选择 自动分配独享的或者共享的 GPU 卡提供给到特定用户。此外 ,用户 可根据分配到的 GPU 插槽,指定自己需要的运行显存的大小来运行相对应深度学习任务。 DeepNEX 同时提供方便、快捷的 Python 编程环境,Shell 终端来时刻运行训练和调参的 环境。深度学习的编程人员可以在申请资源后,秒级打开窗口进入编程状态, DeepNEX 将深度 学习的系统配置、部署、资源分配完全自动化,可以极大提高深度学习的工作效率。 DeepNEX 支持目前主流的多重深度学习框架,支持自动部署和用户预定义功能。 2 DEEPNEX 网络拓扑 DeepNEX 一般会搭建在数据中心中,集中式的管理所有的数据和资源。 DeepNEX 在网络设计 上一般会包含四个网络:管理网络、业务网络、存储网络和计算网络 - 管理网络 :建议千兆网络,用于部署、管理硬件,供运维人员使用,可以与业务网络共享 同一交换机。 - 业务网络:建议千兆网络,用于用户访问 DeepNEX Central、上传数据、下载模型等工 作,可以与管理网络共享使用同一个交换机 - 存储网络:建议万兆网络,用于 DeepNEX 中的用户应用访问共享存储使用 ,可以与计算 网络共享使用同一个交换机。 - 计算网络:建议万兆网络 ,用于DeepNEX 中的应用件互相传递信息使用,可以与存储网 络共享使用一个交换机。 数据中心的所有资源军可以通过网络被外界共享,所有的数据都可以不离开数据中心,将 大大提高数据安全性,并可以为单个应用提供远程的编程和训练环境,使得时刻可以使用深度学 习环境成为一件简单的事情,将大大增强深度学习的应用场景。 1Gb交换机 办公楼 校园网 1Gb交换机 图书馆机房 宿舍 管理模块 管理模块 管理模块 管理网络 DeepNEX01 DeepNEX02 DeepNEX03 FileServer 10G 存储和业务网络 3 DEEPNEX 功能 : • DeepNex 是基于容器的深度学习云平台 • 实现了多租户的深度学习云端开发环境 • 实现了容器技术下对 GPU 资源的调度 ,用户可以选择共享或独占模式。 • 允许在线调节、扩展计算资源。管理员或系统维护人员在修改计算节点模式或添加计算节 点时无需关闭系统 • 可对每个用户的资源 (GPU ,C

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档