- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于hybrid拓扑数据网格副本创建策略
基于hybrid拓扑数据网格副本创建策略
摘要:数据复制技术被广泛应用于数据网格中,以缩短数据访问时间和传输时间、降低网络带宽消耗。针对包含树型拓扑和环型拓扑的混合式网格拓扑结构,提出了一种考虑网络带宽、网络传输延迟、用户请求频率和站点可用存储空间大小等因素的副本创建策略,并引入评估函数衡量各因素的影响大小,具有良好的可靠性、可扩展性和自适应性。模拟实验的结果显示此副本创建策略可以有效降低数据平均访问时间。
关键词:数据网格; 副本创建; 混合的; 拓扑
中图分类号:TP393文献标志码:A
文章编号:1001-3695(2007)11-0286-03
数据复制技术被广泛应用于分布式数据库、移动数据库和Internet等分布式环境中。在数据网格中,通过数据复制在多个站点为同一文件创建多个一致的副本,将数据移动到距离客户更近的地方,可以显著缩短数据访问时间、传输时间,降低网络带宽消耗。多个副本站点分担了初始副本站点的工作负载,有效地提高了系统整体性能,同时多个副本的存在也增强了系统的容错性,避免了单点失效。??
数据复制技术的一个关键问题是如何制订有效的副本创建策略使系统平均响应时间最短、带宽消耗最少,即选择在什么时机、什么地方创建哪个文件的副本。副本创建策略考虑的因素主要包括网格系统的拓扑结构、系统运行负载、存储终端效率、网络状况和数据副本大小等物理特性因素以及用户访问模式[1]。以往的副本创建策略多数依据在层次网格拓扑结构中用户请求文件的频率,本文提出了一种在混合式网络拓扑结构中考虑数据传输时间、用户请求频率和站点存储空间大小等因素的副本创建策略,具有良好的可靠性、可扩展性和自适应性。??
1相关工作??
数据复制策略包括静态复制策略和动态复制策略。静态复制策略是在系统运行之前就已经确定将在哪些站点上创建数据副本,这种方法无法适应网络状态和用户访问模式的变化,因而在数据网格环境下很少采用;动态复制策略则可以随着网络状况和用户行为的变化自动选择创建和删除文件副本,现有的研究都是围绕动态复制策略进行的。??
Ranganathan和Foster在文献[2]中提出了六种应用于层次网络结构中的复制策略:a)不进行复制和缓存,数据全部存储在层次结构的根节点上;b)最佳客户端策略,在请求文件次数最多的客户站点上创建副本;c)瀑布策略,在从根站点到请求文件次数最多的客户站点的路径上依次创建副本;d)缓存策略,各个站点保存所请求文件的副本;e)瀑布策略结合缓存策略;f)快速传播策略,在从根站点到最佳客户站点的路径上的每一个节点都创建副本。实验显示瀑布策略和快速传播策略在用户访问模式具有一定时间相关性或地理相关性时能大大节省平均响应时间。这六种策略都只考虑了用户请求文件的频率而忽视了当前网络带宽的影响。文献[3]提出了一种基于经济模型的复制策略,按照反向拍卖协议确定副本创建位置及进行副本选择,它将数据传输时间作为拍卖的价格指标;文献[4]提出了两种基于层次结构的副本创建算法SBU和ABU,其思想都是将文件复制到距离最佳客户端经过网络跳数最小的站点上,ABU算法更能准确计算出用户请求文件的频率,但这两种算法也没有考虑网络带宽的影响。??
2Hybrid网格拓扑结构??
数据网格中存储的文件大小通常是GB级甚至是TB、PB级,这对网格系统的可靠性和可扩展性提出了更高的要求。为了增强系统的可扩展性,文献[5]在层次式拓扑结构的基础上提出了一种层次型和平面型拓扑相结合的混合式网格逻辑拓扑结构,在此拓扑结构中管理数据副本。平面型拓扑用环型结构表示,层次型拓扑用树型结构表示,并且两者可相互重叠在一起。其网格拓扑结构如图1所示。考虑到真实的广域网连接,应允许一个子节点拥有多组父级节点,用图1中的虚箭头线连接表示。??
环型结构最适合于存在多个副本服务器和P2P应用的情形,而树型结构适合于C/S模式通信的情形。在环型结构中,多个高速连接站点可以采用P2P方式高效地传输数据;在树型结构中,下级站点和父级站点采用C/S模式进行通信,有效利用了位置相关性和网络带宽,并且当有一个父级站点不可用时,子站点还可以与环型结构中的其他父级站点通信,避免了单点失效造成的影响。??
该混合式的拓扑结构增强了网格系统中的数据可用性,并且对层次型结构进行了很好的扩展,同时它能够自动适应因副本的创建和删除而引起的拓扑结构的变化。每当在站点上创建一个数据副本时,系统会在本地副本目录上增加一条物理名称到逻辑名称的映射记录,副本目录信息的改变将传播给兄弟节点和父节点,最终传播至根节点。删除副本也会进行相同的同步更新。新的副本站点加入hybrid拓扑结构中有两种选择,即成为
您可能关注的文档
- 基于Hadoop数据系统数字档案馆信息服务模式研究.doc
- 基于Hadoop数据中心在电力企业应用研究.doc
- 基于Hadoop数据聚类算法研究.doc
- 基于Hadoop智能电网监控系统设计与实现.doc
- 基于Hadoop构架系统平台.doc
- 基于Hadoop校园网盘设计与实现.doc
- 基于Hadoop海量xml索引查询方案.doc
- 基于Hadoop海量小文件存储方法研究.doc
- 基于Hadoop海量嘈杂数据决策树算法实现.doc
- 基于Hadoop海量数据存储技术研究.doc
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
原创力文档


文档评论(0)