精进不休挑战者 解析龙芯GS464E处理器架构.docVIP

  • 60
  • 0
  • 约8.76千字
  • 约 16页
  • 2018-09-17 发布于福建
  • 举报

精进不休挑战者 解析龙芯GS464E处理器架构.doc

精进不休挑战者 解析龙芯GS464E处理器架构

精进不休挑战者 解析龙芯GS464E处理器架构   虽然龙芯是中国最早的自主研发高性能CPU,但针对它的质疑多年来从未停止,近年来传媒上更是出现了“龙芯不如手机CPU”与“下一代龙芯直逼i7”的一黑一白两种论调,众说纷纭之下,MC本期将向大家呈现这篇来自知情人士的稿件。龙芯的性能究竟到了何种地步,其设计水准距离国际竞争对手还差多远,龙芯选择MlPS究竟出于何种考虑,为何今日的龙芯不是基于现在的当红小生――ARM架构?针对这些外界争论多时的问题,本文将用专业而详尽的分析予以解答。   一黑一白,今日孰是孰非?   坦白来说,龙芯近年来在舆论中受到围攻已经不是新闻,今年初一篇名为《国产龙芯究竟水平如何?》的文章在网上掀起轩然大波,直指号称面向高性能服务器开发的龙芯3B-1500处理器尚不如今日ARMCortex-A57手机处理器。耐人寻味的是,不到一个月过后,该文的作者再次撰写了一篇《详解,新一代“龙芯”能否挑战Core i7?》,笔锋一转为尚未正式公开露面的下一代龙芯大唱赞歌。   在不诉诸阴谋论的前提下,笔者认为这样剧烈起伏的舆情其实都指向一个事实:对于龙芯的现状,其实外界并不了解,一般公众并不具备从龙芯组公开发表的艰深论文中推断其结构设计水平的能力,亦并不知晓编译器,相关软件系统与所用基准测试程序的偏好,因此对性能的对比也多有偏颇。例如被抨击为不如Cortex-A57的龙芯3B-1500虽然流片于2012年,但其核心却是2006年左右完成的设计,当时其制定的竞争目标主要是Intel的奔腾3和早期奔腾4处理器,自然会落后于今日的手机CPU旗舰。而被其描述为可以在IPC上与Ivy Bridge一战的新一代龙芯微结构GS464E,虽然相比上一代产品取得了突破性的进步,但在频率指标取得突破之前,又将凭借什么与Intel抗衡呢?笔者将对龙芯目前产品布局给予简单介绍,接着从即将面世的新一代GS464E架构开始进行深度技术解读,仔细分析哪些地方的设计有望比肩国际主流水准,而哪些地方仍然存在不足,再回到一些外界对龙芯认识有所偏差的地方上来提供一个新的视角,以馈读者。   历史原因 为何选择MIPS指令集?   目前已经推出的龙芯核心主要分为三大系??,型号为GSlXX,GS2XXX和GS3XX,其中GSl32系列对标ARM CortexMO和CortexM3,GS232和GS264对标ARM9,ARMll与Cortex-A12,GS464E也就是本文即将介绍的最新版龙芯核心,将对标Intel Ivy Bridge。先前被认为不如手机CPU的龙芯3A 1000与龙芯381500均使用上一代GS464和其向量增强型GS464V核心设计,性能差距较大。   上述所有龙芯系列产品都兼容MIPS指令集,注意这里的兼容并不是如同外界谣传的那样指代龙芯使用了来自MIPS的核心,而是仅仅让龙芯的产品能够运行MIPSN定义的指令集,例如000000在MIPS中代表加法操作码,在龙芯处理器上也代表加法操作码,仅此而已。硬件方面,从龙芯的微结构到电路、版图设计均为独立自主进行。   很多人也有疑惑,为何龙芯没有选择当下如日中天,隐隐与Intel形成分庭抗礼之势的ARM指令集呢?其实龙芯项目开始前期调研的时间点是2000年前后,当时ARM的确有被列入考虑范围之内,但是面对龙芯要求实现高性能的初始目标相比,ARM公司的定位则显得不合时宜,彼时的ARM能拿出的最强核心设计是ARM11,没有乱序执行,没有多发射,没有今天这样先进的缓存系统。ARM旗下第一款支持双发射的Cortex-A8设计是2005年才对外公布的,在此基础上加入乱序执行的Cortex-A9则更是到2007年前后才宣告面世。这倒不完全是因为ARM在高性能设计上实力孱弱,而更多地是因为ARM将自己的产品定位为面向嵌入式计算的产品,极为紧张的面积和功耗预算使得许多高性能设计上常见的特征难以实现。随着技术的进步以及嵌入式计算能力需求的暴增,ARM才开始着手打造高性能CPU。   上世纪90年代,MIPS和DECAlpha等几大厂商都于1995年前后陆续实现了乱序四发射的设计,风头甚至压过当时的Intel、MIPS的R4000、R10000以及DEC Alpha21164。其中21264放眼今日仍然是有志于处理器微结构设计的后学晚辈们所必看的经典之作,深度流水线,分支预测,寄存器重命名,Load-Store推测,一应俱全。虽然在90年代后期MIPS和DEC Alpha逐渐式微,但虎落平阳余威犹在。在x86阵营经营多年的专利壁垒无法攻破的情况下,高性能CPU厮杀的战场上为当时蹒跚起步的中国CPU提供的选择着实不多。以当年的情况看,ARM在多年内都无力进攻嵌入式以外的市场,这意味着ARM的指令集系

文档评论(0)

1亿VIP精品文档

相关文档