- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式共享存储系统分类.doc
四、分布式共享存储系统分类
为了得到编程简易性、低功耗性和可扩展性,分布式共享存储系统在物理分布的主存上实施共享主存模型。因为DSM的共享地址空间分布在本地主存中,查找时必须对这些数据做访问,以决定是否需要的数据在本地主存中。如果不在,系统必须获取数据到本地存储器中。系统还必须以一个写访问来保持共享数据的一致性。以上操作都能在软件、硬件和软硬件结合系统上实施。所以根据可以将DSM系统分为三类:硬件DSM系统、软件DSM系统、软硬件结合DSM系统[2][11]。
4.1 硬件DSM系统
硬件DSM系统能确保本地主存和处理器caches共享数据的自动复制。这种方式能有效的支持细粒度共享。硬件DSM系统采用专门的硬件在由高速互连网络连接的松散耦合系统上实现共享数据的分布、复制、移动以及一致性的维护。由于有专门的硬件来执行,所以在硬件DSM系统中数据的移动和一致性维护所带来的开销比软件DSM系统小得多,因而系统性能较高。但是,硬件实现的复杂性使得在硬件DSM系统中一些先进的一致性维护技术和减少访存延迟的方法很难实现。而且硬件DSM系统的造价较高,因此硬件DSM系统适合于性能大于成本的大型计算机系统。
硬件DSM系统
根据存储系统结构,硬件DSM系统中有三类尤其引起注意[2]:
●高速缓存不统一的存储结构(CC-NUMA)
●Cache只读的存储结构(COMA)
●沉思型的存储系统(RMS)
4.1.1 高速缓存不统一的存储结构(CC-NUMA)
CC-NUMA系统静态地在本地集群主存分布共享虚拟主存地址空间,如图4.1所示,本地处理器和远节点处理器都能访问,但是会有不同的访问延时。这种DSM机制依靠从全映射到不同动态结构的不同地址目录,如单独或双向链表和树。主要目的是通过减少地址目录存储得到高性能和好的扩展性。为了最小化延时,数据的静态划分需要注意,以得到最大的本地访问频率。性能指示器同样很依赖互联技术。无效机制被用来提供一致性,而有些放松的存储一致性模型可以作为提供性能的来源。典型的CC-NUMA系统有:Memnet,Dash和SCI[11]。
图4.1 CC-NUMA结构框图
主存作为网络抽象(Memnet)是最早的一种硬件DSM系统,它提供了共享存储器抽象和严格的一致性语义。该系统的主要目的是通过消息传递避免内部处理器之间的互联通信消耗,以及在没有内核操作系统的干预下为应用软件提供共享存储的抽象。该系统通过一个本地总线双通道存储控制器和一个环形接口来提供一致性技术。当本地主存缺失时,Memnet将发送一个正确的消息在环形中流通,环中每一个Memnet都检查该消息。最近的具有有效副本的集群通过插入有效数据在消息中来满足需求。对于不是单一副本的写请求将发送一个消息来使其它共享副本无效。
DASH全称目录结构的共享主存,它是一种可扩展集群多处理器结构通过应用基于目录的硬件DSM系统机制。其中每四个处理器集群包括了一个等同的全系统共享主存和相应的目录入口。每一个处理器有两级高速缓存,允许其它集群主存以16byte的模块复制迁移。通过基于全映射目录技术来一致性保持,这个主存模块可处于三个状态:uncached、cached、dirty。采用释放一致性模型来提高性能和主存访问优化。并且该系统支持同步操作。
SCI系统全称可扩展的一致性界面,该系统类似DASH,远处主存的数据能存储在本地cache中。SCI标准提供了1Gbyte/s的通信带宽,采用点对点的单向连接。低消耗的SCI系统采用环形连接。SCI中的目录指针存储数量很自然的随着系统大小增长,以获得高的可扩展性。SCI中提出了各种技术以减小延时和支持额外功能。
4.1.2 COMA系统
COMA系统结构(如图4.2所示)采用是本地集群主存作为虚拟共享地址空间数据模块的大型高速缓存。在COMA结构中,所有共享存储单元在系统中不存在一个固定的位置,可以在各个局部存储器中“漂移”,就好像系统中只有Cache存储器一样,这些Cache组成了一个抽象的全局存储器。典型的COMA系统有KSR1、DDM[11]。
图4.2 COMA系统结构图
KSR1结构中的互联网络为多层环状网络,采用顺序一致性模型,粒度为128个字节。DDM结构同样互联网络为多层网络结构,采用顺序一致性模型,但是其粒度为16个字节。
4.1.3 沉思型的存储系统(RMS)
沉思型的存储系统(RMS)数据采用细粒度,允许硬件执行升级机制。系统中的全局共享地址空间被置于本地存储的段之外,通过可编程的映射表格映射到这个区域内,如图所示。该部分共享空间被选择性的复制到不同的集群中。系统采用的算法是基于全复制的MEMW算法。典型的RMS系统有Merlin[11]。
merlin全称Memory Routed, Logical Int
原创力文档


文档评论(0)