- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
w
GCC编译器后端移植技术
摘要:从gcc编译器的体系结构出发,提出了gcc前后端分离的结构以适合移植到不同的硬件平台,分析了gcc后端移植的关键技术。重点阐述后端移植所必须的文件,并详细说明这些文件的作用,给出了rtl中间语言的语法结构以及典型指令的rtl指令模板结构。最后通过一个实例对移植到新硬件体系结构的gcc进行测试,结果表明针对特定的硬件体系结构,gcc后端移植技术是可行的,能够产生正确的汇编语言代码。
关键词:rtl中间语言; 指令模板; 机器描述md; 后端移植
引言
近年来,嵌入式计算机系统被广泛应用于军事及空间领域的各种控制及智能系统中。在这些系统中,嵌入式计算机是系统的核心和智能部件。随着集成电路技术的发展,开始设计生产具有自主产权的专用芯片,并越来越多的将其应用于航空航天等相应嵌入式计算机系统中。同时嵌入式计算机应用的不断发展给计算机技术的各个方面提出了新的要求和挑战。嵌入式系统的开发特征对开发工具提出了特殊的要求。它对于代码大小,代码性能,以及可配置性的苛刻要求,使得在桌面以及服务器端开发中表现良好的编译系统往往不能胜任。这需要为其开发专用的高级语言编译器,但是开发一个完全自主化的编译器往往需要很长时间,并不是一个可取的方案,所以把目光转向可变目标编译器[1]。可变目标编译器能够针对不同的目标机器生成代码。编译器中与机器有关的部分被独立成模块,针对不同的目标机器,这些模块可以方便的进行替换。gcc就是是可变目标编译器,作为开源编译器,它源码丰富,文档详尽,是一个支持多种高级语言和多机器平台的系统,高度优化和可移植性能是该编译系统最为突出的2大特点。本文将详细介绍gcc移植相关的技术。
1gcc体系结构
gcc(gnu complier collection)是一个成功的支持多种高级语言和多种机器平台的系统。gcc体系结构(如图1所示)可以划分为2部分:与语言相关,目标机器无关的前端和与语言无关,目标机器相关的后端。
图1gcc体系结构它是一个典型的语法制导的优化编译器[23],前端通过词法分析,语法分析,语义分析,生成语法树,对语法树简单优化之后,将其转化为中间代码。后端接受前端产生的语法树,将其转换为中间语言的表现形式,在此基础上进行各种优化,然后根据目标机的机器描述生成汇编程序代码[4]。
gcc要实现支持多平台编译,必须解决3个根本问题:需要设计一种较好的中间语言,在适当的层次上,向上能支撑多种语言的映射,向下能够适合多平台转换并且适合于各种优化;需要设计一种对目标机恰当的机器描述;在机器描述与编译主体之间需要仔细的设计一种统一接口。将gcc移植到一个新的硬件系统时,上述3个问题的解决是致关重要的。由于gcc前端与语言相关[5],已经很成熟稳定,能够支持当今流行的大部分高级语言,如c/c++,java,fortran,ada 等,所以不对前端做过多介绍,着重介绍后端技术。
2rtl中间语言
rtl(register transfer language)[6]是一种以一种虚拟寄存器(pseudo register)的方式来叙述计算机行为的语言。rtl有5种对象:表达式,整数,宽整数,字符串和向量。其中最重要的是表达式rtx(rtl expression)。rtx类似于c的结构体,通常用指针来引用它,指针类型定义名为rtx。每个rtx都具有统一的内部数据结构与外部语法。本文只涉及rtx的外部语法,即rtx表达式的文本形式的语法,其一般形式为:(code: m opn1 opn2 ……),
code:rtx操作码。该操作码指明rtx表示的操作类型,如表示一条指令时进行某种说明。此外,code还确定rtx的操作数个数和这些操作数的种类。
m:机器模式。表示数据和运行结果的类型,它反映了数据类型与字长两部分信息。数据类型分为整型,浮点型和复型3种。机器字长则分为8位,16位,32位,64位等。这两部分信息组合所构成的机器方式反映了机器能表示的各种数据类型。
opn:操作数。各个rtx表达式的操作个数以及操作数的种类是各不相同的,这取决于rtx操作码。以下是一个实际的rtx表达式例子,
(insn 7 6 0 (set (mem:si (plus:si (reg:si 54 virtualstackvars)
(const_int 12 [0xfffffff4])) [0 a+0 s4 a32])
(const_int 3 [0x3])) 1 (nil))
操作码“insn”指出这是一条表示指令的rtx,前3个操作数均为整常数,分别表示本条指令编号,前一条指令编号和后一条指令编号,构成前向链和后向链(如图2所示)。其对应的树结构(如图3所示)。
3gcc后端技术
gcc后端对于目标机器的支持全部
文档评论(0)