- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
体系结构第7章 第2讲
* * 对共享数据,不同处理器的Cache都保存有对应存储器单元的内容,因而在操作中就可能产生数据的不一致,称为Cache一致性(Coherence)问题 * * 如果对某个数据项的任何读操作均可得到其最新写入的值,则认为这个存储系统是一致的。包括了存储系统行为的两个不同方面: 第一个方面是指返回给读操作的是什么值(what), 第二个方面是指什么时候才能将已写入的值返回给读操作(when) * * 三条已充分地保证了一致性,什么时候才能获得写进去的值仍是一个重要的问题。 * * 近十年来,这两种协议均得到了发展,但在目前的应用中,写作废协议使用比较广泛。 * * 这两种协议和目录、监听协议的关系? * * 当某个处理器进行写数据时,必须先获得总线的控制权,然后将要作废的数据块的地址放在总线上。其它处理器一直监听总线,它们检测该地址所对应的数据是否在它们的Cache中。若在,则作废相应的数据块。获取总线控制权的顺序性保证了写的顺序性,因为当两个处理器要同时写一个单元时,其中一个处理器必然先获得总线控制权,之后它使另一处理器上对应的拷贝作废,从而保证了写的严格顺序性。 * * 基于总线一致性协议的实现通常采用在每个结点内嵌入一个Cache状态控制器,该控制器根据来自处理器或总线的请求,改变所选择的数据块的状态。 * * 对远程存储器访问的巨大延迟与对本地Cache访问的短延迟相比,突出地反映出了这些缺点。例如,Cray T3E本地访问延迟为两个时钟周期,并且可被流水化,而一次远程访问则需约400个时钟周期(T3E-900, 450MHz Alpha)。 * * 而当系统的规模变大时,它又是致命的弱点。此外,监听的访问量与处理器个数的平方(N2)成正比,即使总线的带宽随系统规模线性增长(N),而实际的性能还是下降到1/N。 * * 仍旧采用在监听Cache中所做的简单假设:对共享数据进行写总会产生一次写失效;处理器封锁该数据直到写操作完毕。因为处理器间不是总线连接,又要避免广播。 假设消息接收和处理的顺序与消息发送顺序相同。但实际情况并不一定如此,从而会产生其它的复杂性。 * * 注意请求的完备性。 * * 基于目录的Cache一致性协议采取了“以空间换时间”的策略,减少了访问次数但增加了目录存储器,它的大小与系统规模N的平方成正比。 基于目录的Cache一致性协议是完全由硬件实现的。 计算机体系结构 * 国家精品资源共享课程:计算机体系结构 第七章:多处理机 国防科技大学计算机学院 主讲人: 教授 第七章 多处理机 反映并行程序性能的一个重要的度量是计算与通信的比率。如果比值较高,就意味着应用程序中相对于每次数据通信要进行较多的计算。 通信在并行计算中的开销是很大的,因而较高的计算/通信比率十分有益。在一个并行处理环境下,当要增加处理器的数目,或增大所求解问题的规模,或者两者同时都增大时,都要对计算/通信比率的变化加以分析。 例如,在增加处理器数目的同时知道这个比率的变化,会对应用能获得的加速比有清楚的了解。 通常状况下,计算/通信比率随着处理的数据规模增大而增加,随着处理器数目的增加而降低。 用更多的处理器来求解一个固定大小的问题会导致不利因素的增加,因为处理器之间通信量加大了。 增加处理器时应该调整数据的规模,从而使通信的时间保持不变。 7.2 对称式共享存储器体系结构 ◆ 多个处理器共享一个存储器。 ◆ 当处理器规模较小时,这种机器十分经济。 ◆ 支持对共享数据和私有数据的Cache缓存。 私有数据供一个单独的处理器使用,而共享数据供 多个处理器使用。 ◆ 共享数据进入Cache产生了一个新的问题: Cache的一致性问题 7.2.1 多处理机Cache一致性 (1) 不一致产生的原因(Cache一致性问题) I/O操作 Cache中的内容可能与由I/O子系统输入输出形成的存储器对应部分的内容不同。 共享数据 不同处理器的Cache都保存有对应存储器单元的内容。 例 两个处理器Cache对应同一存储器单元产生出不同的值 时间 事件 CPU A Cache 内容 CPU B Cache 内容 X单元存储器内容 0 1 1 CPU A读X 1 1 2 CPU B读X 1 1 1 3 CPU A将0存入X 0 1 0 (2) 存储器是一致的(非正式地定义) 如果对某个数据项的任何读操作均可得到其最新写入的值,则认为这个存储系统是一致的。
您可能关注的文档
- 企业研究方法1 什么是企业研究.ppt
- 企业研究方法11 第11章 抽样.ppt
- 企业研究方法10 第10章 资料搜集方法.ppt
- 企业研究方法2 第2章 科学调研.ppt
- 企业研究方法3 第3章 技术与企业研究.ppt
- 企业研究方法5 第5章 企业研究流程.ppt
- 企业研究方法6 第6章 企业研究流程步骤6.ppt
- 企业文化宣传画册PPT模板.pptx
- 企业研究方法7 第7章 实验设计.ppt
- 企业研究方法4 第4章 企业研究流程.ppt
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
文档评论(0)