- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CPU访问内存方式简介1 介绍首先,本文将对3种体系结构的内存访问方式进行介绍,分别为:对称多处理器结构 (SMP:Symmetric Multi-Processor) 海量并行处理结构 (MPP:Massive Parallel Processing)非一致存储访问结构 (NUMA:Non-Uniform Memory Access)然后,通过3种不同体系结构的内存访问实现原理,来对比它们在性能、扩展以及应用方面的优缺点。最后,对NUMA结构的内存分配策略以及如何使用numactl工具优化程序进行介绍。在详细介绍不同体系架构的内存访问方式之前,先对CPU的相关概念、各种总线技术以及内存带宽等概念进行介绍。2 技术背景2.1 CPU相关概念主频(CPU Clock Speed):CPU工作的时钟频率(1秒内发生的同步脉冲数),其速度由外频乘以倍频决定。外频:系统总线的工作频率(系统时钟频率),是CPU与周边设备传输数据的频率。具体是指CPU到芯片组之间的总线速度(如CPU与主板之间同步运行的速度)。倍频:主频与外频之比的倍数(主频=外频×倍频),理论上从1.5到无限大,以0.5为一个间隔单位进行增加。注:CPU的性能并不是完全由主频决定,是由主频、管线架构或长度、功能单元数目、缓存设计四个方面共同决定,通常将后面三个要素统称为CPU架构。2.2 FSB(Front Side Bus)在Nehalem微架构之前,Intel 的CPU和北桥芯片之间的通信都一直使用FSB,其体系架构如下所示:说明:由于Intel使用了“四倍传输”技术,可以使系统总线在一个时钟周期内传送4次数据,也就是传输效率是原来的4倍。如:在外频为N时,FSB的速度增加4倍变成了4N。FSB的速度指的是CPU和北桥芯片间总线的速度,更实质性的表示CPU和外界数据传输的速度。外频的概念是建立在数字脉冲信号震荡的基础上的,它更多的影响了其他总线的频率(如PCI总线与SATA总线)。如:主板可以通过“二分频”技术将外频降一半,使得PCI设备保持在标准工作频率。优点:整体成本低。缺点:由于只采用一条FSB总线,多处理器访问内存时会对FSB总线进行抢占,使得多处理器系统间互联和可扩展性差。2.3 QPI(Quick Path Interconnect)/cpu_index/subcate28_125_list_1.htmlIntel在Nehalem微架构的CPU中首次集成了内存控制器(IMC,Integrated Memory Controller)和引入了QPI连接方式,这样CPU和北桥芯片之间的通信使用QPI取代了前端总线,其体系架构如下所示:说明:Nehalem微架构的CPU被设计为核心(Core)与非核心(UnCore)两部分。CPU的执行流水线、L1、L2 Cache都集成在核心中,而L3 Cache、IMC、QPI以及功耗与时钟控制单元都被集成在非核心中。QPI是在CPU中集成内存控制器的体系架构,主要用于多CPU间互联以及CPU与芯片组间互联的通信,使用QPI后CPU可直接通过内存控制器访问内存资源,而不是以前繁杂的“前端总线—北桥—内存控制器”模式。由于QPI应用于多CPU间互联以及CPU与芯片组间互联,因此可以灵活的修改CPU中集成的QPI数量。如:在针对双路CPU的系统中,将集成两组QPI。需要注意的是:QPI并非一种I/O接口, CPU仍然采用PCI-Express来处理I/O通讯问题。优点:CPU集成内存控制器,由于CPU和内存之间的数据传输不再需要经过北桥芯片,因此可以缩短CPU与内存之间的数据交换周期。缺点:由于内存控制器是集成在CPU内部,因此内存的工作频率与CPU相同,而且不能进行频率异步设置,这样的话在CPU超频的时候会导致内存的频率同CPU的外频一起升高,一旦超过内存的承受能力,就会导致内存无法工作,这会大大限制CPU的超频能力。针对使用QPI的体系架构,对如下几个时钟概念进行介绍:Base Clock(BCLK):也叫Bus Clock,即外频。Core Clock:即主频,Core Clock= Base Clock * 倍频。UnCore Clock(UCLK):由BCLK乘以UnCore倍频得到。UCLK既不是内存频率也不是QPI频率,UCLK不能低于内存频率的4倍,这也就是其内存规格限制所在。QPI Clock:由BCLK乘以QPI倍频得到。由于内存控制器的集成,它的频率大大超出了需要,所以在超频时如果会碰到瓶颈,直接降低它的倍频即可。(在BIOS里设置)Memory Clock:由BCLK乘以内存倍频得到,内存性能直接受此频率影响。2.4 内存带宽数据传输最大带宽取决于所有同时传输数据的带宽和传输频率,公式如下所示:数据带
原创力文档


文档评论(0)