- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第48卷第1期计算机学报Vol.48No.1
2025年1月CHINESEJOURNALOFCOMPUTERSJan.2025
CAInNet:面向AI加速的通算一体网内计算模型
市杨翔瑞杨凌高源航王宝生苏金树
刘忠沛吕高锋
(国防科技大学计算机学院长沙410073)
摘要AI时代的到来对当今算力提出了双重挑战,一方面涉及推理,另一方面涉及分布式训练。将一部分分布
式应用的计算任务卸载到高速网络的网卡或交换机能够潜在提升分布式应用的性能表现,并发挥网络的关键作
用。如在交换机或网卡中卸载参数聚合等计算功能能够有效降低模型训练时产生的大量通信开销。基于P4语言
的可编程数据平面除了使网络协议定制更加灵活外,还使得网络数据平面能够为分布式应用提供简单的网内计算
服务。然而,当前典型的基于P4语言的可编程数据平面架构如协议无关交换架构(PISA)在进行矩阵运算等方面
还表现得不够高效。分析该缺陷的关键原因在于:PISA架构中的超长指令字计算引擎在处理大规模并行同构计
算任务时效率不高。针对上述问题,提出了一种面向AI加速的通算一体网内计算模型CAInNet。该模型在传统
可编程数据平面的基础上,创新性地融合了单指令多数据流(SIMD)与多指令多数据流(MIMD)两种计算模式,使
得网络设备不仅能够支持协议无关网络分组处理,还能在分组传输过程中对承载AI推理与训练的数据做网内计
算。为了验证CAInNet在网内计算以及网络可编程方面的能力和效果,我们在该模型中使用带内网络遥测实现网
络可视化,并部署多层感知机(MLP)模型实现基于AI的报文分类,替代传统的基于TCAM查表的路由方法。实
验表明,采用机器学习推理的报文分类方法在包含5k路由表项的场景下,其准确度高达98.3%,同时节省了
98.7%的存储空间,有效地解决了路由爆炸问题。与现有方法相比,将机器学习推理部署在CAInNet中不增加可
编程数据平面的处理延迟,且仅消耗适量计算资源。
关键词AI硬件加速;通算一体;网内计算;可编程网络;报文分类;深度神经网络
中图法分类号TP393D0I号10.11897/SP.J.1016.2025.00019
CAInNet:In-NetworkComputingModelforAIAcceleration
LIUZhong-PeiYANGXiang-RuiYANGLingGAOYuan-Hang
LUGao-FengWANGBao-ShengSUJin-Shu
(CollegeofComputerScienceandTechnology,NationalUniversityofDefenseTechnology,Changsha41oo73)
AbstractTheoperationandserviceprovisionofdistributedmachinelearningmodelsareinsepa-
rablefromcomputingpowerandnetworksupport.AsMooresLawslowsdownandtherateof
computingpowergrowthismuchslowerthantherateofI/O,near-dataprocessinghasbecome
theinevitablechoiceinthepost-Mooreera.Inshort,itmeansmovingdataaroundaslittleas
possiblesothatitcanbeprocessedonthe
您可能关注的文档
- 市场信号如何提升竞价排名机制的经济效率--基于搜索引擎平台数据的实证分析.pdf
- 基于多模态信息融合的中文隐式情感分析.pdf
- 开放地球引擎OGE设计与研制.pdf
- 我国数字经济融合特征及其变化趋势分析.pdf
- 化工流程模拟软件发展现状与趋势.pdf
- 生物信息学与生物制造:论生物大数据及其数据挖掘在生物制造中的重要性.pdf
- 高等教育资源配置何以成为推动新质生产力发展的引擎——基于2012—2021年省级面板数据的实证分析.pdf
- 工业互联网平台赋能研究:前沿探析、内在机理与未来展望.pdf
- 双U_f下垂控制下双极MMC-HVDC系统交流阻抗建模及稳定性分析.pdf
- 面向以太坊的高效多版本状态存储方案.pdf
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
初级会计持证人
专注于经营管理类文案的拟写、润色等,本人已有10余年相关工作经验,具有扎实的文案功底,尤善于各种框架类PPT文案,并收集有数百万份各层级、各领域规范类文件。欢迎大家咨询!
文档评论(0)