- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
指令集编译模拟:一种快速灵活的指令集模拟技术
Mehrdad Reshadi Prabhat Mishra Nikil Dutt
嵌入式系统体系结构和编译实验室ACES
嵌入式计算机系统中心,加州大学尔湾分校,美国
摘要
指令集模拟器是探索和验证新的可编程体系结构的重要的工具。归根于体系结构的复杂度增加以及研发到投产的时间压力,性能成为了一个指令模拟器最重要的特性。解释型模拟器虽然灵活但是速度较慢,然而编译型模拟器在牺牲了灵活性的同时获得了速度。本文将介绍一种新型的技术来获得一种快速的指令集模拟器结合了编译型模拟器和解释型模拟器的好处。我们实现了一种快速的指令精确模拟通过两种机制。首先,我们将解码过程带来的较大时间开销从运行时间移至编译时间,同时维护了解释型模拟的灵活性。其次,我们使用了一种新的指令集抽象技术来进行积极优化,进一步提升解码过的指令的模拟性能。我们的指令集编译模拟ISCS技术,做到了40%的性能提升,相对于我们已知的最好的灵活的解释型模拟。我们将举例ISCS技术在ARM7嵌入式处理器上的应用。
类别与学科描述
I.6.5[模拟与建模]:模型开发
I.6.7[模拟与建模]:模拟支持系统
一般术语
设计,性能
关键词
编译模拟、解释模拟、体系结构、指令抽象
介绍
一个指令集模拟器是一个运行在宿主机器上模仿一个应用程序运行在目标机器上行为的工具。指令集模拟器是在新可编程体系结构开发中不可缺少的工具。它们被用于验证一个体系结构设计,一个编译器设计,以及在设计空间探索期间验证体系设计方案。
传统的解释型模拟器虽然灵活但速度慢,在这个技术里,一条指令被取到后,解码,运行时执行如图1所示。在一个软件模拟器里指令的解码是一个严重消耗时间的过程。
图1:传统解释型模拟器流程
编译型模拟器在编译时间里完成了应用程序的解码来提升模拟器性能如图二所示。为了进一步提升模拟器速度,基于静态编译的技术将指令调度移动到了编译阶段。然而,所有的编译型模拟器都是基于这样的假设的基础之上:完整的程序代码在仿真开始之前已知,也就是说是运行时静态的。由于这个假设,很多应用领域上编译型模拟器是无法使用的。例如,嵌入式系统因为使用外部程序存储所以无法使用编译型模拟器,因为程序代码是无法在运行之前预测到的。类似的,编译型模拟器并不适用于那些处理器含有多套指令集的嵌入式系统。这些处理器可以在运行时切换到一个不同的指令集模式。例如,ARM处理器使用Thumb(减少位宽)指令集来减少功耗和内存开销。这个动态的指令集切换模式无法被一个编译型模拟器考虑到,因为依赖于运行时数值的选择是无法预测的。而且,程序含有运行时动态代码,例如,由操作系统提供的,无法被编译型模拟器寻址。
图2:传统编译型模拟器流程
因为编译型模拟器的限制,解释型模拟器被普遍地使用在嵌入式系统的设计流程里。本文将介绍一种新的技术来生成一个快速的指令集模拟器,它结合了传统编译型模拟器的的性能和解释型模拟器的灵活性。我们的指令集编译模拟技术达到了高的性能是因为两个原因。首先,解码过程中的时间开销被移到了编译时但依然能维护解释型模拟器的灵活性的优点。假如一个指令在运行时被修改了,该指令将在执行之前被重新解码。其次,我们使用了一种指令集抽象技术来生成优化的解码指令集来进一步提升模拟器的性能。IC-CS技术获得了比当前公开的性能最强具有灵活性的解释型模拟器更好的性能。使用了IC-CS技术的模拟器获得了40%的性能提升在这个方面最好的结果上。
本文的其余部分将按照如下顺序,第二章节介绍寻址解释型模拟器技术的相关工作。指令集编译模拟器技术(IC-CS)将在第三章节中介绍。第四章节介绍一种常见的嵌入式处理器ARM7的模拟器结果。第五章节将对本文进行综述。
相关工作
近来工作的一个主要方向是编址指令集结构模拟,包括了具备最强的灵活性但速度最慢的解释型模拟器和快速的编译型模拟器。最近关于指令集模拟器的地址转移的研究使用了一种机器描述语言。
Simplescalar[3]是一个广泛使用的解释型模拟器但没有为功能级模拟做任何的性能优化。
Shade[5],Embra[10]和FastSim[8]模拟器使用动态二进制转换和结果缓存来提高模拟效率。Embra提供了最高的灵活性和最大的性能但是不是可移植的,它被限制于MIPS R3000/R4000体系结构的模拟。
一个快速的可移植的模拟器技术将被展示[6]。它改进了传统的静态编译模拟,通过进一步利用宿主机器的资源。这样的利用是通过对专用的ISA模拟器定义一些低级指令生成接口来实现的,甚至是如传统途径地使用C的指令生成接口。
基于体系结构描述语言ADL的可移植的快速模拟器的框架在FACILE[9],Sim-n
您可能关注的文档
- “细胞分裂” 在遗传中的应用.doc
- “遗传与进化” 模块中“假说一演绎法” 的教学.doc
- “植物向性运动” 和“植物生长调节剂对植物生长发育影响” 的实验设计.doc
- 15-18 世纪中国资金市场发育水平蠡测.doc
- afp 基因导入花粉管对杏果实发育影响的研究.doc
- DNA 分子标记技术在甘薯种质资源和遗传育种中的应用现状.doc
- IPC 预防术后静脉淤滞与DVT Intermittent sequential pneumatic compression of the legs in the prevention of venous stasis and postoperative deep venous ….doc
- UV-B 增加对菠菜生长发育和品质的影响.doc
- 苯甲酸单晶的制备及晶体结构, 能带结构和光学性质的第一性原理计算.doc
- 扁穗牛鞭草种质遗传多样性的ISSR 分析[J].doc
原创力文档


文档评论(0)