LEC12_实践是最好的课堂.pdf

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LEC12_实践是最好的课堂

实践是最好的课堂 龙芯处理器设计的启示 胡伟武 1 提 纲 • 龙芯处理器简介 • 知耻而后勇的性能提高过程 • Simulation-Silicon Correlation (硅是检验设计的唯一标准) • Balanced Design (结构设计要统筹兼顾) • Optimization (结构设计要重点突出) • Pico-Architecture Design (面向工艺的结构设计) 2 龙芯处理器简介 持续改进的过程 • 龙芯1号:有了 • 2001年5月正式启动龙芯CPU的研制 • 2002年8月研制成功龙芯1号是我国第一个通用处理器芯片 • 龙芯2号:积累 • 处理器的每年性能提高三倍; • 龙芯2E/2F主频1GHz,在64位单处理器设计方面达到世界先进水平 • 龙芯2F批量生产,几十个应用 • 龙芯3号:跨越 • 四核龙芯3A流片成功并量产、8核龙芯3B流片成功 • 形成自己的特色和竞争优势 • HotChips, IEEE Micro, ISCA、HPCA、ISSCC等国际著名刊物和会议发表龙芯3号结构 X3X3 X3 X3 4 GS464处理器核特点 • MIPS64兼容,增加SIMD型多媒体指令以及X86虚拟机指令 • 四发射超标量结构,两个定点、两个浮点、一个访存部件 • 每个浮点部件可扩展成256位SIMD部件 • 访存部件支持128位存储访问,虚地址和物理地址各为48位 • 支持寄存器重命名、动态调度、转移预测等乱序执行技术 • 64项全相联TLB,独立的16项指令TLB,可变页大小 • 一级指令Cache和数据Cache大小各为64KB,4路组相联 • 支持Non-blocking访问及Load-Speculation等访存优化技术 • 支持Cache一致性协议,可用于片内多核处理器 • 指令Cache实现奇偶校验,数据Cache实现ECC校验 • 支持标准的EJTAG调试标准,方便软硬件调试 • 标准的128位AXI接口 5 龙芯2号处理器核(GS464 ) 6 龙芯处理器结构设计心得 • 短短5年走过了处理器结构设计近二、三十年的发展历程,难 得有这样的经历 • 结构设计可以采用跨越的方法(如龙芯1号采用动态调度、龙 芯2号采用四发射乱序执行),但认识的提高,经验的增长是 无法跨越的 • “小步快跑”的技术路线加速了认识提高和经验增长的过程 • 寓乐于苦,每个芯片流片成功只能有1-2天的短暂欢乐,但是 够了 7 Table 1. SPEC_int2000 and SPEC_fp2000 of Godson Processors SPEC Programs Godson-1(200MHz)‏ Godson-2B(250MHz)‏ Godson-2C (450MHz)‏ Godson-2E ( 1GHz)‏ 164.gzip

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档