【重点研报】AI+DC白皮书.pptx

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;前言;谢海

——中国铝业集团CIO;邹志磊

——华为公司高级副总裁;目录;第1章

AI World总体愿景

及宏观驱动力;;;每个应用和软件都值得用AI重写;第2章

All in AI

生成式业务系统;;;企业发展AI首先要梳理应用场景,建立“点线面”

的场景地图。而AI业务价值三角,则可作为识别场景业务价值的经验范式和向导。其中,通过AI助手提升业务效率和用户体验,是企业AI应用最基础和常见的方式,如办公、HR、客服等;当AI深入生产环节后,常常能够带来生产力和竞争力的提升,如在线顾问、工艺优化、需求和供应预测等;最后是对黑天鹅式低概率风险的防范,如业务连续性风控、财务风险识别等。;语言大模型表现出强大的“内容生成”能力,不仅仅

是人机对话、知识问答,还包括看图说话、情绪识别等非结构化信息生成结构数据的能力,工程设计、代码设计等非结构化强规则的文本生成能力。围绕知识密集型场景,在语言大模型的延长线上出现了大量数字化助手类应用,如客服、代码开发、专业问题咨询、舆情分析、辅助设计等。;;算力的选择也是技术路线的选择。AI算力供应链的

可持续是路线选择的前提,不仅要考虑硬件的长期可获得性,还要考虑软件栈的可持续性。大模型训练与推理过程中,模型参数规模从数十亿到万亿,这不仅要求算力平台具备强大的并行计算能力,也要求算子

(执行基本运算任务的软件模块)具备高效的执行效率,从而最大程度释放硬件计算、内存访问、卡间通;;第3章

智能时代

数据中心的发展与变化;;大型互联网企业和专注于大模型训练的模型公司,其

AIDC规划建设目标明确,即支撑基础模型预训练。这是一项大工程,需要超大规模集群的算力平台支持,还需要收集和处理万亿级别的Token数据,以确保模型能够学习足够的知识和技能。这种规模的训练不仅仅是技术上的挑战,更是对资源调配和系统运维管理能力的巨大考验。;;综上所述,最终能够成功应对上述挑战的小型AIDC,需要具备“形态灵活、快速部署快速升级、轻量极简、易维易用”

等特征。;系统摩尔是华为最初在《数据中心2030》报告中提出的概念,它定义为一种??的算力提升方法,主要依赖系统

级架构创新、算存网深度协同、软硬深度协同来提升算力,满足指数级增长的算力需求。;五、新管理

新的管理模式必须具备跨域协同管理的端到端系统运维能力,涵盖计算、存储、网络、光模块设备的管理、控制以及分析等全生命周期运维管理。具体包括以下几个方面:;;;除了传统数据中心面临的安全风险,AIDC还要面

临新的安全挑战。一是AI内容生产过程的“黑盒”特性,导致其输出内容具有很大的不确定性和不可解释性,带来较大的应用风险,尤其是一些对输出内容要求比较严格的场景。二是AI系统面临新型安全攻击的威胁,大模型基于统计和语言规则的预测机制使得它很难区分是合法的指令还是恶意的输入,攻击者可以通过精心设计的提示词来操纵大模型,如在2023年中针对ChatGPT的“奶奶讲故事”漏洞,诱导AI执行本应禁止的操作。三是潜在引入新的数据安全风险,大模型在训练过程中可能会接触到大量;垂直整合的需求;第4章

典型AI DC规划与建设;;1;群中的数据传输更加高效。二是超大规模组网架构技

术,如华为星河AI网络采用两层框盒及三层盒盒的确定性组网架构,确保了大规模集群中的数据传输稳定性和可靠性,能够实现十万卡以上的超高速网络互联。;无论是日均调用数万次以上的典型模型,还是能力持续发展的超大模型(超大参数、超长序列、多模态),在

实现高效推理方面都面临较大的挑战,需要采用如下关键技术:;;通过AI联动调优降低能耗,提升系统可靠性。AI联

动调优大脑采集到环境、制冷设备、供电设备、IT设备、训推任务等参数,通过能耗优化模型、器件故障预警模型等实时预测最佳工作参数,并下发调优策略,实;科大讯飞打造极致算效的

超大规模AI算力集群;大型AIDC;;通过这样的架构设计,企业不仅能够提高模型应用的

稳定性和可靠性,还能在快速变化的市场环境中充分利用最新的模型能力,从而保持竞争优势。这种架构不仅提升了企业的灵活性,还增强了系统的整体稳定性和可扩展性。;为了应对企业在AI开发过程中普遍存在的开发效率低、成本高、模型一致性低、可靠性差以及模型部署时间长

等问题,需要构建一个高效的AI开发平台,以提升开发效率并降低开发成本。该平台的核心能力包括以下三个方面:;能源基础设施的高效,核心是满足智算液冷与通算风冷混合部署需求,当前主要面临如下挑战:;为应对AIDC更加复杂的运维和新型安全风险挑战,必须构建新一代运维管理平台及安全防护体系,以提升管

理效率。;某大型银行打造“一底座、两平台、三中心”的技术

文档评论(0)

行业研究报告 + 关注
实名认证
服务提供商

市场分析:提供详细的市场规模、市场趋势、市场需求以及竞争格局的分析,帮助客户了解行业的现状和发展前景。 竞争对手研究:深入分析主要竞争对手的市场份额、业务模式、优势劣势等,提供差异化竞争策略建议。 行业动态:跟踪行业最新的政策法规、技术创新和市场动向,帮助客户及时掌握行业变化。 客户需求分析:研究目标客户的偏好、消费习惯和需求变化,为产品定位和市场营销提供支持。 投融资分析:分析行业内的投融资活动和资本流向,帮助客户评估投资机会和风险。

版权声明书
用户编号:7144145123000015

1亿VIP精品文档

相关文档