- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多核平台上支持推测并行化的事务存储体系结构性能优化计算机系统结构专业论文
摘要摘要
摘要
摘要
随着多核平台的普及,如何利用多核加速串行应用的执行已成为学术界和工 业界共同关注的热点研究问题。而传统的显式锁同步机制自身就有着高复杂性、 易错性和性能保守等天然缺陷,从根本上限制了并行程序的可扩展性和编程效 率,也限制了对多核资源的充分利用。为了开发更多的多核结构上可利用的线程 级并行性,利用事务存储(Transactional Memo巧,TM)技术来解决并行程序正确 性维护给并行编程带来的复杂性和对性能的制约问题,已成为学术界和工业界的 共识。本文从有效开发应用中的线程级并行性入手,着眼于高效能、易编程和可 兼容这三个目标,通过软硬件协同的优化方式对支持推测并行化的多核事务存储 体系结构展开深入研究,使之既能提高多核芯片片上计算资源的有效利用率,又 能有效降低并行编程难度,平滑移植传统应用软件。
本文从线程划分和线程执行两个方面,对软硬件协同支持推测并行化的多核 事务存储体系结构性能优化开展了深入系统的研究,涉及结构模型、编程模型、 性能分析模型、离线剖析指导线程划分机制和在线剖析指导线程执行机制等方面 的内容。主要研究内容和成果包括:(1)对两种主流线程级推测并行技术的发展 趋势进行了详细而深入的调研,通过对其软硬件支持机制的分析与比较,提出了 一种新型的软硬件协同支持推测并行化的多核事务存储体系结构设计方案。该系 统在线程划分中采用软件线程级推测技术思想,而在线程执行时采用硬件事务存 储技术支持,并通过离线剖析和在线剖析技术来协同各种软硬件因素,达到了同 时提高程序性能和降低并行编程难度的双重目标。(2)在软件线程划分方面,从 简化并行编程和提高并行执行性能的优化角度出发,提出了一套线程级推测并行 性的判定准则、研究方法和剖析机制,确定了利用离线剖析技术来实现基于事务 存储的线程划分方案。并依据该机制设计并实现了一套线程级推测并行性离线剖 析工具集OpenPro。(3);1t用OpenPro工具集,对桌面应用、多媒体应用和高性能 计算应用中影响线程级推测并行性的关键因素进行剖析,从应用本身并行潜能的 角度进行探讨,获得了诸如单个程序仅能有效利用16核的计算资源是当前多核 技术路线的拐点等一些重要认识。(4)在线程执行支持机制方面,从可扩展性好 和易于硬件实现这两个优化目标出发,提出了一种支持优先级判定的基于目录的 高速缓存一致性协议,并在此基础上设计和完成了-乖b幂t用运行时库机制同时支 持线程级推测和事务存储语义的分布式可扩展多核事务存储处理器P1vr硬件模 拟器。该处理器设计突破了以往类似方案中总线等集中式结构对硬件系统可扩展 性的限制,同时实现了可扩展性好和易于硬件设计实现的目标;而这套采用积极
摘要版本管理和积极检测机制的分布式硬件事务存储机制会自动维护硬件系统的一
摘要
版本管理和积极检测机制的分布式硬件事务存储机制会自动维护硬件系统的一 致性,极大地减少了程序员在进行并行程序设计时的繁杂工作和复杂程度。这对 于普及并行程序设计,提高并行程序生产力都有着非常重要的意义。(5)提出了 一种针对线程级推测并行技术的PCL性能分析模型,并依据该模型提出了将在 线剖析技术引入PTT硬件模拟平台的最终优化方案。同时通过对P1vr系统多种 软硬件手段实现机制的分析与协同,分别从正确性、有效性和灵活可配置性三个 层次对其进行了充分的评测和分析。
本文的研究工作获得了如下一些重要的认识:(1)将线程级推测技术与事务 存储技术结合起来,通过软硬件因素的合理协调,可以有效地开发出串行程序中 潜在的线程级并行性,同时有效地降低并行编程的难度,极大地提高并行程序设 计生产力。(2)在目前以传统超标量单核构造多核芯片的技术路线下,着眼于同 时兼顾硬件的有效利用率和尽可能挖掘程序中固有的并行性,在加速单个串行应 用时,部分依赖严重的应用(如SPEC和一些依赖严重的科学计算程序等)采用 2.4核就已经足够;而多数多媒体应用和高性能计算应用采用8.16核来加速比较 合适;一些特别适合的应用则可以有效利用64.128核及以上的计算资源。(3)虽 然现在线程级推测并行技术在桌面应用这样一些程序中数据依赖严重的应用中 效果不佳,但在部分拥有大计算量、推测线程粒度适中并且存在模糊依赖的多媒 体和高性能计算应用中还是适宜采用的。线程级推测并行技术最大的优势是其兼 容性与易编程性,只要在这两点上做好文章,实现多数经典应用软件到多核平台 上的平滑移植,进一步解放程序员,线程级推测并行技术就会在体系结构研究中 拥有重要的一席之地。
本文的研究工作和结果可用于指导共享存储的多核芯片体系结构及其并行 编程环境的设计,以尽可能小的并行程序设计难度、系统软件复杂性和系统硬件 代价,尽可能多地从串行程序中开发出多核芯片上可利用的线程级并行性。
您可能关注的文档
- 轻型广域测量系统信息系统研究与开发分析电气工程专业论文.docx
- 生长素和油菜甾醇在拟南芥根重力应答中的相互作用分析植物学专业论文.docx
- 三维结构licoo2纳米阵列的可控制备及其电化学性能研究材料工程专业论文.docx
- 若干有机半导体材料中载流子传输性能的理论研究物理学原子与分子物理专业论文.docx
- 扫描式手机屏疵病检测仪信号处理技术研究仪器仪表工程专业论文.docx
- 石墨烯诱导压电聚合物的高压相变研究材料学专业论文.docx
- dwi对脑静脉和静脉窦血栓形成的诊断价值研究神经病学专业论文.docx
- 中国银行外汇收支业务管理系统的设计与实现软件工程专业论文.docx
- 复合地层土压平衡盾构隧道掘进参数与安全控制技术研究建筑与土木工程专业论文.docx
- 二氧化碳高效缓蚀剂的筛选及缓蚀性能研究材料工程专业论文.docx
- 非指示性教学理念下的语文教学课件设计与应用研究学科教学语文专业论文.docx
- 面向移动gis的agent技术方法研究及应用试验地图学与地理信息系统专业论文.docx
- ipop组合直流变换器及其控制策略的研究电力电子与电力传动专业论文.docx
- tx公司绩效管理体系改进研究工商管理专业论文.docx
- 带有多重v形非等高肋片的太阳能空气集热器的传热与流动特性数值研究动力工程专业论文.docx
- 一种家庭服务型机器人移动平台开发机械电子工程专业论文.docx
- 变强度薄壁直梁的抗撞性优化车辆工程专业论文.docx
- 深基坑开挖及支护结构优化设计建筑与土木工程专业论文.docx
- 茶多酚丙烯酸系高吸水树脂的制备及其性能研究茶学专业论文.docx
- 一体式pcr激发探测系统的研究光学工程专业论文.docx
文档评论(0)