- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云计算导论概要
GOOGLE浏览器算法引擎总结 云计算一班李明慧
Google搜索引擎算法是在不停调整的,可以分为以下几个阶段:
2000年12月:发布了浏览器工具条
2003年11月:推出了升级版的Florida;这次升级主要是针对一些现在早已过时的黑帽作弊手法,比如关键词堆砌等等
2005年1月:为了应付Spam以及控制链接质量,Google谷歌,Yahoo,Bing三大巨头共同推出了Nofollow标签。
2007年5月:Universal Search传统的10条结果界面自此一去不再复返,Google谷歌在其搜索结果将会包含更多的内容,其中包括新闻,视频,图片,本地信息以及其他一些内容。
2009年2月:Vince
2010年5月:May Day是Google针对长尾关键词的一次算法升级,很多低质量内容的网站都受到了打击,特别是一些电子商务网站。此次升级同样也是熊猫行动的一个预兆。
2010年12月:Social Signals(社会化因素) Google谷歌与Bing必应均确认,他们会引用社会化因素作为新的排名依据,包括Facebook及Twitter上的数据。Matt Cutts这对Google来说是一个相对比较新的开发行动,尽管所有的SEO工作者已经对此期盼了相当长的一段时间。
2011年2月:熊猫算法/内容农场 这是Google谷歌2011年来做出的最大的一次算法升级,在全世界范围内引起了共同的关注。从Google官方数据得知,此次升级影响了12%的搜索结果。熊猫算法主要针对那些低质量内容,内容农场、广告内容比过重以及其他一些质量因素。此次升级对一些大型站点都造成了非常显著的影响。(反垃圾网站的搜索引擎算法,旨在降低低质量内容的网站排名的算法,同时也是Google的网页级别评判标准之一。)
2012年4月:企鹅算法 Google谷歌在4月推出企鹅算法。开始清理过分SEO的网站,特别针对网站间大量使用的交换链接、黑链等传统提升SEO的方式进行“打击”。(其目标直指那个通过过分SEO手段提高排名的网站,意在降权那些充斥着广告的网站。随后,谷歌预计在4月底开始惩罚“过度优化”的网站排名,并鼓励那些使用白帽技术的优化工程师。)
2015年5月:Mobilegeddon Google Mobilegeddon算法的移动排名提升是页面级别。比如网站只有10个页面移动友好,那也只有这10个页面在移动搜索排名会提升,其它页面没影响。与百度不同(百度并没有真的抓取很多移动页面),Google是真的用移动蜘蛛抓取很多移动页面的。
Google每年的算法改变高达500-600次,只不过很多改动都很小,微小的有时候无法察觉(也能理解,排名没有影响,站长们就不会深入去仔细观察)。但是每个几个月,Google都会做一次比较大的算法升级,这些升级都会直接影响到搜索的排名结果。
网页排序算法
网页排序算法其实只是一个统称,并不对应一个唯一的具体算法,而是一个混杂了多种算法的排序逻辑,本质上是一个排序系统。就好像一道菜的做法,从洗菜、腌制、烹煮、调味是有很多道工序的,不是一句“大火烹算法”或“小火煮算法”能概括的。所以不能简单地说谷歌在用A算法,而百度在用B算法。两套系统是由不同研发人员,在不同的时间和地域,基于不同的资源、用户需求、用户反馈、设计思想、评价方式构造的两个不同的排序系统。可以类比MSN和QQ,亚马逊和天猫,它们的展现形式和使用体验或许类似,但内部构造的区别却是方方面面的。
PageRank只是其中一个特征,它离整个排序系统还差得很远,就像毛笔质量和如何考中状元的关系一样。
PageRank算法(网页排名,又称网页级别、Google左侧排名或佩奇排名)
PageRank是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。
PageRank算法原理
PageRank的计算充分利用了两个假设:数量假设和质量假设。步骤如下:
1)在初始阶段:网页通过链接关系构建起Web图,每个页面设置相同的PageRank值,通过若干轮的计算,会得到每个页面所获得的最终PageRank值。随着每一轮的计算进行,网页当前的PageRank值会不断得到更新。
2)在一轮中更新页面PageRank得分的计算方法:在一轮更新页面PageRank得分的计算中,每个页面将其当前的PageRank值平均分配到本页面包含的出链上,这
文档评论(0)