网站大量收购独家精品文档,联系QQ:2885784924

浅析搜索引擎算法的几个因素.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析搜索引擎算法的几个因素 搜索引擎算法是保密的,而且据说每天都在调整,具体没人知道。但是Ethan 认为搜索引擎算法源自两个方法论:程序推理和用户判断,程序推理分为两个维 度:相关性和重要性,用户判断分别为相关性和重要性乘上个系数。关键词相关 性由网页文本域内的关键词密度和分布决定。重要性也叫权重,一个网页的权重 由这个网页的血统和内容品质共同决定。由此,Ethan总结出搜索引擎算法的四 个方面:关键词相关性、网页血统、网页内容品质、用户判断,不妨称之为搜索 引擎算法的四大因素。大家从这四个方面思考,往往可以为被广泛认可的seo操 作找到理论依据,培养自己的seo 思维。有了seo 思维,才能突破教条式的操作 规定,在seo实战中灵活应变。 排名不是针对网站的,而是针对网页的。当用户搜索一个关键词时,搜索引 擎从以下四个方面分析被收录的页面,算出一个总分,总分最高的,排在自然排 名的第一位。 一、关键词相关性 网页文本域是Ethan创造的一个概念,想说明的意思是,搜索引擎在判断关 键词和网页之间的相关性的时候,不仅仅考察网页内的文字,还会考察网页外的 文字,主要包括反向链接锚文本的文字、反向链接页面的主题文字、域名的主题 文字,所有这些文字构成了这个网页的文本域。所谓主题文字,就是搜索引擎会 为每个域名和每个页面赋予一些文字,这些文字体现了这个域名或这个页面的主 题。大家都知道meta 标签里有keywords 和description,可以这样想象,搜索引 擎为页面增加了一些meta 标签,包括域名的主题文字、反向链接1的锚文本、反 向链接1所在页面的主题文字、反向链接1所在页面的域名的主题文字、反向链接 2的锚文本、反向链接2所在页面的主题文字、反向链接2所在页面的域名的主题 文字等等。这些meta 标签的权重要远高于keywords 和description,有的甚至高 于页面可见文字。有了网页文本域的概念,我们就能够理解外链建设等很多seo 操作。 注意搜索引擎会根据用户的搜索意图,把用户搜索的关键词翻译成内部实际 查询的关键词。多数情况下两者是一样的,但有的时候两者不一样。比如知道了 用户的ip 来自哪个地区,那么那个地区的相关页面会优先显示,有种用户搜索 时加进了地域性文字的效果。再比如近义词分析,搜索引擎会把近义词的搜索结 果也列出来。 关键词和一个网页的相关性由网页文本域内的关键词密度和分布决定,越相 关,排名越靠前。 二、网页血统 网页血统是Ethan 创造的一个概念,想说明的意思是,在搜索引擎看来,一 个网页天生就具备一种权重,这种权重来自url。搜索引擎会分析一个网页的url, 得到两种重要信息,第一是域名的情况,域名是有权重的,会直接传递到这个页 面;第二是反向链接的情况,每个反向链接所在页面也是有权重的,也会传递到 这个页面。我们经常遇到的pr 值,主要体现了通过反向链接传递的权重。 注意域名的权重不等于首页的权重,搜索引擎会根据首页的权重、网站整体 的情况(比如网站的稳定性和渐进性、站内是否有很多定向锚文本等等)、其它因 素(比如域名寿命等等)决定域名的权重。 一个网页的血统越好,权重越高,排名越靠前。 三、网页内容品质 在重要性方面,网页血统是传递性因素,单纯由外部传入;网页内容品质是 结构性因素,由这个网页自身相关的各种特质决定。这方面搜索引擎虽然不够智 能,但还是有很多手段的,其中最重要的是内容的原创性如何和内容的新鲜度如 何,特别是内容的原创性。还有比如网页中是否有定向锚文本和反向链接锚文本 是否定向,搜索引擎认为如果一个页面认真地写了定向锚文本或其反向链接锚文 本为定向的,说明这个网页内容品质较高。细节一些的,比如页面中有个图片会 更好一点,页面中适当使用list 标签会更好一 点,段落的开头适当出现“首先”、 “其次”这种词汇会更好一点,等等。 一个网页的内容品质越好,权重越高,排名越靠前。 四、用户判断 相关性和权重,数据源都不是来自用户的判断,搜索引擎很清楚,最重要的 是用户觉得好不好。虽然这方面获取数据源异常艰难,但搜索引擎还是有些办法 的,比如搜索跳出率,比如百度统计和google 分析,比如社会化网络的数据, 这是以后搜索引擎算法的发展方向,对排名的作用会越来越大。Ethan相信,搜 索引擎为了获取用户判断的数据源,会不惜血本。 本文由掏宝整理发布,

您可能关注的文档

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档