全球领先搜索引擎运作机制与技术架构.pdfVIP

全球领先搜索引擎运作机制与技术架构.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

云计算原理

拥有全球最强大的搜索引擎。除了搜索业务以外,还有

Maps、Earth、、等各种业务,包括刚诞生的Wave。

这些应用的共性在于数据量巨大,而且要面向全球用户实时服务,因此

必须解决海量数据和快速处理问题。的诀窍在于它发展出简

单而又高效的技术,让多达百万台的廉价计算机协同工作,共同完成这些前所未

有的任务,这些技术是在诞生几年才被命名为云计算技术。

云计算技术具体包括:文件系统GFS、分布式计算编程模型MapReduce、

分布式锁服务Chubby和分布式结构化数据系统Bible等。其中,GFS提

供了海量数据的和的能力,MapReduce使得海量信息的并行处理变得简

单易行,Chubby保证了分布式环境下并发操作的同步问题,Bible使得海量

数据的管理和组织十分方便。本章将对这四种技术进行详细介绍。

2.1文件系统GFS

文件系统(Fiystem,GFS)是一个大型的分布式文件系

统。它为云计算海量,并且与Chubby、MapReduce以及Bible

等技术结合十分紧于所有技术的底层。由于GFS并不是一个开源的系

统,我们仅仅能从公布的技术文档来获得一点了解,而无法进行深入的

研究。文献[1]是公布的关于GFS的最为详尽的技术文档,它从GFS产生

的背景、特点、系统框架、性能测试等方面进行了详细的阐述。

当前主流分布式文件系统有RedHat的GFS[3](GlobalFiystem)、的

[4][5]

GPFS、Sun的Lustre等。这些系统通常用于高性能计算或大型数据,对

硬件设施条件要求较高。以Lustre文件系统为例,它只对元数据管理器MDS提

供容错解决方案,而对于具体的数据节点OST来说,则依赖其自身来解决容

错的问题。例如,Lustre推荐OST节点采用RAID技术或SAN区域网来容错,

但由于Lustre自身不能数据的容错,一旦OST发生故障就无法恢复,

因此对OST的稳定性就提出了相当高的要求,从而大大增加了的成本,而且

成本会随着规模的扩大线性增长。

正如所说的那样,创新固然重要,但有用的创新更重要。创新的价值,

取决于一项创新在新颖、有用和可行性这三

文档评论(0)

153****2416 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档