- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
9.2 多线程与超线程处理机 2002年秋,英特尔公司推出一款采用超线程(Hyper Threading, HT)技术的Pentium 4处理机,原有的单个物理内核经过简单扩展后被模拟成两个逻辑内核。 9.2.1 指令级并行与线程级并行 超标量处理机的水平浪费与垂直浪费 垂直浪费 如:资源冲突会导致不能继续执行新指令 水平浪费 如:指令相关导致多条流水线中部分流水线被闲置 9.2 多线程与超线程处理机 硬件线程的概念 并行的概念就从指令级并行扩展至线程级并行 多线程处理机的具体的实现方法又可分为: 细粒度多线程(交错多线程)处理机 粗粒度多线程(阻塞多线程)处理机 9.2.2同时多线程结构 同时多线程(Simultaneous Multithreading, SMT) 结合了超标量技术和细粒度多线程技术的优点,允许在一个时钟周期内,处理机可以执行来自不同线程的多条指令,因而可以同时减少水平浪费和垂直浪费。 9.2 多线程与超线程处理机 9.2.3 超线程处理机结构 超线程技术是同时多线程技术在其Intel系列处理机产品中的具体实现。 为了支持两个硬件线程同时运行,让每级流水线中的资源通过三种方式之一复用于两个线程: 复制、分区或共享。 9.3 多处理机 多处理机系统由多个独立的处理机组成,每个处理机能够独立执行自己的程序。 并行向量处理机(PVP) 对称多处理机(SMP) 大规模并行处理机(MPP) 分布共享存储器多处理机(DSM) 9.3 多处理机 PVP SMP DSM MPP 9.3 多处理机 机群式超级计算机结构 9.4 多核处理机 9.4.1 多核处理机的优势 ——三高三低: 高并行性:可同时执行的线程数或任务数是单处理机的数倍。 高通信效率:各个处理机核只需要在核内部的相对较小的区域内交换数据。 高资源利用率:多核结构可有效支持片内资源共享。 低功耗:不再依靠提高主频改善性能。 低设计复杂度:每个核的结构相对简单。 较低的成本:各个核共享器件芯片封装和芯片I/O资源。 9.4 多核处理机 9.4.2 多核处理机的组织结构 同构多核处理机与异构多核处理机: 同构多核(homogenous multi-core)处理机 所有计算内核结构相同,地位对等。 异构多核(heterogeneous multi-core)处理机 各个计算内核结构不同,地位不对等。 一般多采用“主处理核+协处理核”的主从架构。 9.4 多核处理机 9.4.2 多核处理机的组织结构 多核处理机的对称性: 对称(Symmetric MultiProcessing,SMP)多核 处理机片内包含相同结构的核,多个核紧密耦合,并运行一个统一的操作系统。 非对称(Asymmetric MulitiProcessing,AMP)多核 若是同构多核,但每个核运行一个独立的操作系统或同一操作系统独立实例,就变成非对称多核。 AMP多核系统也可采用异构多核和共享存储器构成。 9.4 多核处理机 9.4 多核处理机 9.4.3 多核处理机的关键技术 多核处理机架构: 每个核自身的结构 每个核是否应该采用超标量技术或超线程技术 多核之间的对等性,核的数目 同构多核,阿姆达尔定律(Amdahl‘s law) 异构多核,集成图形处理机(Graphic Processing Unit,GPU)。 9.4 多核处理机 9.4.3 多核处理机的关键技术 多核系统存储结构设计: 处理机内核心数目增多,各核心采用共享存储器结构进行信息交互,对主存的访问需求进一步增加。 目前仍然采用存储器分级的方式解决存储速度问题: 采用二级甚至三级cache提高等效访问速度 片内cache容量尽可能增大 共享cache和私有cache 9.4 多核处理机 9.4.3 多核处理机的关键技术 多核处理机的cache一致性: 多核cache内容不一致的原因: 可写数据的共享 I/O活动 核间线程迁移 cache一致性的维护: 软件方法:预防 硬件方法:发现和解决——目录协议、监听协议 9.4 多核处理机 9.4.3 多核处理机的关键技术 多核处理机的核间通信与同步技术: 三种互联结构: 总线共享cache结构 交叉开关互连结构 片上网络结构 三种互联结构的相互融合 多核之间的同步和互斥 9.4 多核处理机 9.4.3 多核处理机的关键技术 连接8个处理机核和8个内存模块的交叉开关结构 9.4 多核处理机 9.4.3 多核处理机的关键技术 二维网状网络片上网络结构 9.4 多核处理机 9.4.3 多核处理机的关键技术 低功耗设计: 低功耗设计
您可能关注的文档
- 计算机控制术王建华主编第二版第三章课后答案.doc
- 计算机应用础教案1认识计算机.doc
- 计算机控制术试验.doc
- 计算机控制统(单选题).doc
- 计算机控制统课设.doc
- 计算机操作础Word练习题.doc
- 计算机控制统实验平台.doc
- 计算机操作础word练习题答案.doc
- 计算机操作系统题库.doc
- 计算机文件式大全.doc
- 2025年智能快递驿站行业政策与市场机遇报告.docx
- 2025年校园安全防范中新能源电动巡逻车采购可行性分析.docx
- 2025年智能垃圾分类智慧监管平台在智慧旅游区的应用前景研究.docx
- 2025年智能家居报告:人工智能伦理风险的法律责任与用户隐私保护.docx
- 2025年智能垃圾分类与垃圾分类信息化管理结合的可行性研究.docx
- 2025年智慧社区远程医疗诊断中心在基层医疗机构运营管理中的应用报告.docx
- 2025年智慧社区:老年活动广场智能化升级研究.docx
- 2025年智能社区新能源电动巡逻车市场应用前景分析报告.docx
- 2025年智能垃圾分类智慧监管平台在垃圾分类回收与处理中的智能化改造路径.docx
- 2025年本土半导体材料产业链国产化战略布局报告.docx
文档评论(0)