一种节省资源的矩阵运算单元硬件微架构设计.pdfVIP

一种节省资源的矩阵运算单元硬件微架构设计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2024年3月1日现代电子技术Mar.2024

第47卷第5期ModernElectronicsTechniqueVol.47No.5

160

160

DOI:10.16652/j.issn.1004⁃373x.2024.05.028

引用格式:潘于,田映辉,张伟,等.一种节省资源的矩阵运算单元硬件微架构设计[J].现代电子技术,2024,47(5):160⁃166.

一种节省资源的矩阵运算单元硬件微架构设计

11123

潘于,田映辉,张伟,杨建磊,申奇

(1.海光信息技术股份有限公司,北京100193;2.北京航空航天大学,北京100191;

3.中国联通智能城市研究院,北京100037)

摘要:为了实现人工智能和高性能计算在不同应用领域下的快速运算,需借助人工智能加速器(NPU)或者通用图形

处理器(GPGPU)对其进行加速。由于矩阵运算是人工智能和高性能计算的核心运算,文中提出一种节省资源的矩阵运算单

元架构的实现方案。通过对矩阵运算单元中每个子运算单元中的乘法器和加法器数量进行扩展,并将输入数据按行列广播

到矩阵运算单元上的各个子运算单元可实现对矩阵运算的加速。通过利用PE矩阵之间的数据共享,采用新型的PE矩阵互

联方案,可达到在减少带宽资源的同时提升算力的目的。与现有NPU或GPGPU的矩阵运算实现方案相比,所提方案使用更

少的加法器和寄存器即可实现相同的算力,且在更低的时钟延迟和带宽消耗下即可完成对相同规模矩阵运算的加速。

关键词:人工智能;高性能计算;矩阵运算;节省资源;低时钟延迟;GPGPU

中图分类号:TN02⁃34;TP183文献标识码:A文章编号:1004⁃373X(2024)05⁃0160⁃07

Designofhardwaremicroarchitectureofresource⁃efficientmatrixoperationunit

11123

PANYu,TIANYinghui,ZHANGWei,YANGJianlei,SHENQi

(1.HygonInformationTechnologyCo.,Ltd.,Beijing100193,China;

2.BeihangUniversity,Beijing100191,China;

3.ChinaUnicomSmartCityResearchInstitute,Beijing100037,China)

Abstract:Itisnecessarytouseartificia

您可能关注的文档

文档评论(0)

教师资格证、公共营养师持证人

本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。

领域认证该用户于2024年07月07日上传了教师资格证、公共营养师

1亿VIP精品文档

相关文档