体系结构第1章.ppt

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
体系结构第1章

* * * * * * * 显示系统的占比比较高,因为现在机器很多时候用来做媒体处理或者视频处理 * * 修正的(或者脚本化)应用程序 测试英特网应用用的比较多,在测试英特网应用时我们不知道服务器的机器,结构,平台,但是要完成的任务我们是知道的,我们把任务写成脚本形式来描述,并提供给服务器,服务器通过对脚本的处理来完成对应用完成响应的结果的过程,这个过程我们可以得到比较好的测试结果 核心程序 拿不到真实程序或者真实程序太大时 小测试程序 某些特定特征 如3D 硬盘 等 * * * * * * 普适原则,但在体系结构设计中经常体现。例如:溢出的处理。 * * * * 改进系统的时候如果只单独过多的对一个部件进行改进,那这样的改进带来的系统的效率优化的收益将会越来越小,比如加内存 通过定理:系统改进后的性能是由不可改进的部分决定的 比如买机器 * * * 这个加速比不是很高,但是要达到这样的效果却需要花费很大很大的代价 * * * * * * 细化:每种指令处理时间不同。 * * * * * * * * * * * 内存4*1G与2*2G 整个课程中会贯穿使用定量分析的方法,定量分析方法是90年代以来计算机系统设计采用最有效的途径。 * * * 还有其它角度? * 越高级对硬件的抽象越大。 * 越高级对硬件的抽象越大。 * 有时没有这一级。 * * 虚拟IO设备、存储空间、Xten * 不仅仅是符号化的机器语言 比如 INT 21h 翻译的结果是指令集里的若干指令(call)并启动对Window封装的“DOS系统调用”接口。最后映射到底层驱动程序,与输入输出打交道。 * * * 对历史智力资源的继承 * 总线的变化改变了传输速度,性能等的变化,但是保证了其兼容性,兼容性的重要性主要体现在软件兼容上。 * * * * 向上兼容或向后兼容:体系结构不断发展; 向下或向后:IA32;顾及老的结构或技术以兼容软件。 * 保护方式指令集 支持虚存的指令集 MMX指令集 数字处理指令集 * * * LSI,大规模集成电路 VLSI 超大规模集成电路 Very large scale integration. * * 早起计算机语言是面向机器性能的语言,早起决定一个程序员好坏的标准是程序员对机器性能的发挥,而现在的标准是考量程序员使用程序设计的效率。一个应用完成所需要的时间。 作为语言实现的支撑,随着现在的高级语言也越来越复杂,所以编译技术也要相应的发展。 操作系统 比如DOS和windows的区别 比如单任务和现在并行处理系统。又如:批作业,机器只完成一个工作,而现在的系统完成很多工作。 软件工具是指我们调试,使用,测试,检查机器所需要的一系列的工具,可以帮助我们提高效率,提高程序的产出率。 中间件是随着现在软件的复杂产生的一系列软件,比如和网络结合的使用,避免了每一个人程序员都去了解非本身领域的知识。 * * * * * * * Amdahl定律练习 f 程序的最大加速比Smax为: Amdahl定律练习 例2: 求平方根和浮点乘是图形应用中常用的转换,假设求平方根操作在某机器的一个基准程序中占总执行时间的20%,浮点乘操作在该程序中占总执行时间30%,现通过两种方法加速两操作 ① 增加专门的硬件处理求平方根,使其执行速度为原来的10倍 ② 通过调整流水线把浮点乘速度提高为原来的1.6倍 问: 采用两种方法增强后此基准程序加速比是多少? Amdahl定律练习 30% 20% 加速比= 增强前时间/增强后时间 =1/(0.5+0.2/10+0.3/1.6) =1/0.7075 =1.41 程序局部性 程序访问地址的分布不是随机的,而是相对地簇聚 包括时间局部性和程序的空间局部性 程序的时间局部性 程序即将用到的信息很可能就是目前正在使用的信息 程序的空间局部性 程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者临近 生产-消费局部性 CPU的性能 程序执行过程中所处理的指令数,记为IC 每条指令执行所需要的时钟周期数CPI (Cycles Per Instruction) CLK:整个程序执行消耗的总时钟周期数 每条指令执行所需要的平均时钟周期数 深入CPU性能公式 假设计算机系统有n 种指令,其中第i 种指令的处理时间为CPIi ,在程序中第i 种指令出现的次数为ICi 。(f为cpu频率) 深入CPU性能公式 其中: 反映了第i种指令在程序中所占的比例。 CPU性能公式练习 例:假设我们考虑条件分支指令的两种不同设计方法如下: CPUA:通过比较指令设置条件码,然后测试条 件码进行分支。 CPUB

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档