SIMD向量指令的非满载使用方法研究.pdfVIP

  • 9
  • 0
  • 约1.44万字
  • 约 5页
  • 2016-02-04 发布于天津
  • 举报
第42卷 第 7期 计 算 机 科 学 Vo1.42No.7 2015年 7月 Computer Science July2015 SIMD向量指令的非满载使用方法研究 徐金龙 赵荣彩 赵 博 (信息工程大学数学工程与先进计算 国家重点实验室 郑州450001) 摘 要 大规模 SIMD体系结构提供 了更强的向量并行硬件支持,但是 ,大量迭代次数不足的循环 由于不能提供足够 的并行性,难以用等价的向量方式实现。为了更有效地利用SIMD,提 出了一种非满载地使用SIMD指令的向量化方 法。研究了向量寄存器的使用方式,基于非满载的向量寄存器使用方式实现了非满载的向量操作和短循环的向量化, 并将非满载的向量化方法用于一般循环的向量化。提供 了收益分析方法来为本向量化方法作精确指导。实验结果表 明了该方法的有效性,所选测试用例的 目标循环被向量化,平均加速比达到 1.2。 关键词 大规模 SIMD,并行,向量化 ,非满载向量操作,收益分析 中图法分类号 TP311 文献标识码 A DOI 10.I1896/j.issn.1002—137x2015.7.049 ResearchonNon-fullLengthUsageofSIMD VectorInstruction XU Jin-long ZHAO Rong-cai ZHAO 13o (StateKeyLaboratoryofMathematicalEngineeringandAdvancedComputing,UniversityofInformationEngineering,Zhengzhou450001,China) Abstract Large-scaleSIMD architectureprovidesstrongervectorparallelsupportonhardware.However,alargenum— berofloopswhichareshortofiterationscannotprovidesufficientparallelism.anditiSdifficulttoachievethem with theequivalentvectormode.InordertomakefulluseofSIMD,thispaperpresentedavectorizationmethodwhichcan usenon-fulllengthofSIMD vectorinstruction.Thispaperstudiedthevectorregisterusage。achievde anon-fullvector operationbasedOnnon-fulllengthusageofvectorregister,whiehcanvectorizeshortloops.Finally,thismethodwas used toveetorizethecommonloops.Moreover,Thispaperprovidedabenefitanalysismethodtoguidethevectorization method.Experimentalresultsshow thatthemethodisavailable,thetargetloopsoftheselectedtestprogramsarevec— torizedandtheaveragespeedupisabout1.2. Keywords Large-scaleSIMD,Parallel,Vectorization,Non-fullvectoroperation,Benefitanalysis 因而无法向量化。若vF(VectorFactor,向量因子 ,向量操作 1 引言 对

文档评论(0)

1亿VIP精品文档

相关文档