- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114968374B(45)授权公告日2025.07.04
(21)申请号202210849632.X
(22)申请日2022.07.19
(65)同一申请的已公布的文献号申请公布号CN114968374A
(43)申请公布日2022.08.30
(73)专利权人山东省计算中心(国家超级计算济南中心)
地址250014山东省济南市科院路19号
专利权人齐鲁工业大学(山东省科学院)
(51)Int.CI.
GO6F9/38(2006.01)
GO6F9/48(2006.01)
GO6F15/80(2006.01)
(56)对比文件
曹宗雁.高性能计算集群运行时环境的配置优化.科研信息化技术与应用.2011,02(06),第52-61页.
审查员杨杨
(72)发明人刘弢陈仁江刘召远田敏
郭莹潘景山赵大伟吴晓明杨美红
(74)专利代理机构济南金迪知识产权代理有限公司37219
专利代理师杨树云
权利要求书2页说明书10页附图2页
(54)发明名称
一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法
(57)摘要
CN114968374B本发明涉及一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,包括:将应用程序中的多层循环程序段和硬件架构相互对应,实现各层循环到硬件架构上的代码级映射;根据硬件架构层次不同,分别进行进程级和线程级的并行优化,其中,进程级优化即节点内通信优化和节点间的通信优化,使得各个进程在各自通信域中进行集中通信,减少程序优化过程中各个进程之间的通信;线程级优化即
CN114968374B
核组0核组1核组2从核阵列
循环网络
核组3核组4核组5
CN114968374B权利要求书1/2页
2
1.一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,其特征在于,包括:
将应用程序中的多层循环程序段和硬件架构相互对应,实现各层循环到硬件架构上的代码级映射;根据硬件架构层次不同,分别进行进程级和线程级的并行优化,其中,进程级优化即节点内通信优化和节点间的通信优化,使得各个进程在各自通信域中进行集中通信,减少程序优化过程中各个进程之间的通信;线程级优化即核组内主从传输优化;
将应用程序中的多层循环程序段和硬件架构相互对应,实现各层循环到硬件架构上的代码级映射,包括:
将应用程序中的第1层循环对应到申威众核处理器;此层为进程级优化;将应用程序中的第2层循环对应到进程组中的单个进程;此层为进程级优化;将应用程序中的第3层循环对应到单个核组内的单个从核簇或者从核;此层为线程级优化;如果存在应用程序中的第4层循环,并且应用程序中的第3层循环将代码段映射到从核簇上,那么,将应用程序中的第4层循环对应到从核簇内的单个从核上;此时第4层循环之间的信息传递采用的是从核簇内的寄存器通信;此层为线程级优化;否则,结束。
2.根据权利要求1所述的一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,其特征在于,将应用程序中的第1层循环对应到申威众核处理器,包括:
每1个处理器上包括6个核组,每个核组对应1个进程,这6个进程划分为1个进程组;该进程组对应到应用程序段的最外层循环,外层循环的次数等于处理器即进程组的个数,即第1层循环之间的信息传递采用的是跨节点通信。
3.根据权利要求1所述的一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,其特征在于,将应用程序中的第2层循环对应到上述进程组中的单个进程,包括:将应用程序中的第2层循环以块划分或者循环划分的方式分配到每个进程中,每个进程对应处理器的1个核组;处理器上的6个核组平均处理应用程序中的第2层循环的所有循环次数;应用程序中的第2层循环中信息传递为节点内通信。
4.根据权利要求3所述的一种基于新一代神威超级计算机的多层循环进程级和线程级协同自动优化方法,其特征在于,将应用程序中的第2层循环以块划分或者循环划分的方式分配到每个进程中,包括:应用程序中的第2层循环中有若干次循环,将其任务平均分配到进同一处理器上的进程组中的6个进程上进行计算,平均分配方式使用块划分或者是循环划分的方式进行分配;
循环划分是指:0
您可能关注的文档
- CN114528244B 异构系统音频数据交互处理方法、装置及存储介质 (珠海全志科技股份有限公司).docx
- CN114531932B 一种光伏发电系统、光伏逆变器及检测光伏组串对地故障的方法 (华为数字能源技术有限公司).docx
- CN114545475B 一种复杂环境下的多源组合导航定位方法 (南京航空航天大学).docx
- CN114546638B 基于高性能并行优化的海洋数据同化方法及系统 (中国科学院计算技术研究所).docx
- CN114551778B 制造由碳、硫和ptfe所构成的均质化混合物的方法 (耐驰干法研磨技术有限公司).docx
- CN114565836B 紫外放电图像-高光谱图像的污秽绝缘子状态评估方法 (国网青海省电力公司检修公司).docx
- CN114581955B 近视防控方法、装置、系统、存储介质和设备 (苏州科医世凯半导体技术有限责任公司).docx
- CN114594779B 贴边清扫轨迹规划方法、装置及电子设备、存储介质 (智道网联科技(北京)有限公司).docx
- CN114598970B 音频处理方法、装置、电子设备及存储介质 (北京小米移动软件有限公司).docx
- CN114612494B 一种动态场景下的移动机器人视觉里程计设计方法 (南京理工大学).docx
原创力文档


文档评论(0)