- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
://
httwww.skx.com
pjj
:/
DOI10.11896skx.241100030
jj
输入感知的通用矩阵向量乘算法在的自适应性能优化
GHonDCU
yg
,
李庆12贾海鹏2张云泉2张思佳1
大连海洋大学信息工程学院辽宁大连
1116023
中国科学院计算技术研究所北京
2100190
()
l2454885722@163.com
()(),、
摘要通用矩阵向量乘法函数是基础线性代数子程序算法库的核心组成部分广泛用于计算机科学工
GEMVGBLAS
.,,
程计算和数学计算等领域当前随着国产HonDCU版本的不断迭代升级HonDCU与传统GPU生产商之间也存在一
ygyg
;,.,
定的竞争优势随着GEMV应用领域的不断扩大GEMV的输入特征体现出多样化的趋势在这种背景下单纯靠一种优化
,.,、、、、
方法无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能因此在访存优化指令重排并行规约共享内存
,,
线程排布等传统优化手段的基础上提出了一种输入感知的性能自适应优化方法其能够根据输入矩阵的不同规模和形状自动
,.,
调整计算的实现方式以达到最佳性能显著提高了在上的性能实验结果表明在
kernelGEMVHonDCUHonDCU
ygyg
,
您可能关注的文档
- 适老化色彩设计在高血压药品包装中的应用研究.pdf
- 适应、回避与抵抗:“用户—算法”关系视角的社交媒体计算广告应对机制.pdf
- 适应度反向学习的平衡灰狼算法及其应用.pdf
- 适应故障模式的运载火箭载荷计算方法.pdf
- 适应梯度变化的普适在线凸优化算法.pdf
- 适应未来的山地城市可持续扩张绿色基础设施网络建设——以云南省临沧市为例.pdf
- 适应于硬件部署的神经网络剪枝量化算法.pdf
- 适应中国人群的乳腺钼靶X线图像分类辅助系统设计.pdf
- 适用过程模拟的碳排放计算系统开发.pdf
- 适用于UTXO模型定长存储的轻节点研究.pdf
- 医院护理培训课件:《简易呼吸球囊的使用》.pptx
- 5-1遥感图像几何处理-构像方程.pptx
- 第5章证券投资的收益和风险ppt课件.pptx
- 三上三年级道法知识点归纳.docx
- 易经智慧和保险人生共41页文档-6deb2491178884868762caaedd3383c4ba4cb48b.ppt
- 提高VTE风险患者预防措施落实率.pptx
- 资源量估算与矿体三维建模系统统操作手册.docx
- 第27讲 句段的作用(练习)(原卷版).pdf
- 第27讲 书面表达之图画作文(练习)-2024年中考英语一轮复习讲练测(全国通用)(解析版).pdf
- 第44讲 话题作文(练习)-2024年中考语文一轮复习讲练测(全国通用) (原卷版).pdf
原创力文档


文档评论(0)