智算中心暨电力大模型创新平台解决方案(51页PPT).pptxVIP

智算中心暨电力大模型创新平台解决方案(51页PPT).pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

;;;;

结合行业发展报告,12个重点场景有较大AI算力需求及发展空间,;

l场景:利用无人机搭载高清摄像头采集输电线路影像,通过视觉大模型识别线路缺陷。

l应用价值:实现缺陷自动识别,准确率≥99%,减少人工巡检工作量,提升巡检效率和安全性。国产化适配:采用昇腾GPU+MindSpore视觉框架,适配国产硬件和深度学习平台。;;;

1.对外连接网络(网络出口层)分为CMNeT、云

专网、IP专网

1.CMNeT:用于公众用户访问智算中心

2.云专网:用于智算中心间互联、训推互联

3.IP专网:用于远程管理

2.内部互联网络分为业务/存储网络、管理网络、

参数面网络、数据面网络

1.业务/存储网络:业务网络用于互联网用户访问智算/通算等资源,存储网络用于调用共享存储资源

2.管理网络:主要包括业务管理(K8S平台、安全管理系统等)和IPMI

3.参数面网络:采用RoCE/IB实现集群内所有AI加速卡的高速互联

4.数据面网络:采用RoCE实现智算集群与高性能文件存储的高速互联;;;;

1.数据预处理

?数据清洗、标准化及特征工程

2.模型训练

?输入:标准化后的数据集

?昇腾集群分布式计算:

?多节点并行计算梯度

?参数服务器架构更新模型参数

?节点间同步最新参数

?验证评估:

?定期计算预测误差

?反馈调优信号指导模型优化

3.模型压缩

?将FP32转换为INT8量化推理模型

?优化模型体积和计算效率

4.边缘部署

?推送INT8模型至变电站NPU节点

?完成边缘侧模型部署;

监控与调优参数;;

技术特点:支持-25℃~55℃宽温工作,适应户外

变电站部署。

应用场景:确保设备在极端环境下的稳定运行。

国产化适配:采用国产散热技术,提升设备的环境适应性。;

性能指标:热层2000万IOPS,温层500GB/s带宽,冷层10GB/s顺序读写,满足不同数据存储需求。

存储层级:热层采用华为Dorado8000NVMeSSD,温层采用曙光ParaStor500KHDD,冷层采用阿里云OSS冷存储。

数据类型:热层存储训练数据集和模型Checkpoint,温层存储历史巡检影像和SCADA数据,冷层存储归档模型和十年期数据。;;;;;;

方案设计说明??

1、AI计算集群:AI计算集群间采用4*200GBRDMA网络,满足高带宽低时延通信需求;各节点同时通过25G网卡接入上联裸金属TOR并接入业务核心交换机。

2、HPC计算节点:采用100GBRDMA网络搭建超算集群,各节点同时通过10G网卡接入上联业务TOR,再上联接入存储核心交换机。

3、通用计算区:各服务器通过25G网卡接入上联计算TOR,为租户提供云主机、块存储等产品。

4、高性能存储:通过100G网络组成并行文件存储集群,提供给超算及智算集群使用。

5、SDN网络区:提供SDN设备,实现VxLAN封装/解封装,完成Overlay与Underlay切换。

6、网络互联区:由管理核心、业务核心、存储核心及汇聚交换机组成,用于南北向以及东西向流量。

7、管理区:提供带外和带内管理,带外通过1个GE网卡接入IPMI交换机,带内通过10GE接入管理TOR。

8、出口区:配置公网出口、专线接入以及运维专线等网络,满足公网用户、校内用户以及运维人员接入需求。;

……;

设计说明

l通用宿主机通过4*25GE(含计算、存储网)上联至计算TOR;

lSDN管控节点2*25GE上联至计算TOR;

lironic(裸金属服务)和

DHCP节点2*25GE上联计算TOR,2*25GE上联至裸金属TOR;

l块存储节点采用4*25GE上联至计算TOR;

l块存储采用千兆管理网,其余管理网采用两口万兆网卡上联至管理交换机。;;;;

实施路径规划l第29页

三阶段投资计划;;

收集并整理数据:收集现有的客服对话数据、客户行为数据等,用于训练AI模型;对数据进行清洗、标注等

文档评论(0)

安狗狗方案 + 关注
实名认证
服务提供商

专注分享全行业解决方案

1亿VIP精品文档

相关文档