- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SEO实战密码第二讲了解搜索引擎
5.7 星号: 通配符,代表任何文字 5.8 inurl:用于搜索查询词出现在URL页面中,可以更准确地找到竞争对手 5.9 inanchor:导入链接锚文字中包含搜索词的页面 5.10 allintitle:返回的页面标题中包含多组关键词的文件 5.11 allinurl:返回的页面中需包含所有搜索词出现在URL页面 5.12 link:搜索某个URL的反向链接,包括内部和外部链接 5.13 linkdomain:只适用于雅虎,返回某个域名的反向链接 5.14 related:只适用于google,返回与某个网站相关联的页面 5.15 总和使用高级搜索指令:综合多个指令,搜索更精确 6 面对的挑战 思考 至今为止有多少种搜索引擎的算法? 主流搜索引擎算法,各种算法的工作原理,及优劣势? 是否受语言差异的影响? 思考我国百度、360等主流搜索引擎的工作原理及相互间差异。 * * * 3 链接原理 李彦宏超链分析专利 HITS算法 TrustRank算法 Google PR Hilltop算法 李彦宏超链分析专利 1997 “超链文件检索系统方法”专利申请 链接词库:链接锚文字,及其链接指向 /netacgi/nph-Parser?patentnumber=5,920,859 一个用于检索查询相关的文件与索引文件的超链接指向那些按照文件的搜索引擎。? 遍历的索引数据库,发现超文本信息,包括文档的超链接指向的地址和每个超链接的锚文本。? 该信息存储在一个倒排索引文件,它也可用于计算各指向一个特定的文档的超链接文件链接载体。? 当输入一个查询,搜索引擎发现因在其锚文本的查询字词的文件所有文件载体。?也是一个查询向量计算,点查询的载体,每个文件链接向量积的计算方法。?产品的点与特定文件的总结,以确定每个文件的相关性排名。 李彦宏超链分析专利 建立一个链接词库,记录链接锚文字的一些相关信息,如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接总数,包含特定关键词的链接都指向哪些页面。词库不仅包含关键词原型,也包含同一个词干的其他衍生关键词。 根据这些链接数据,尤其是锚文字,计算出基于链接的文件相关性。在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合使用,得到更准确的排名。 李彦宏超链分析专利 要判断哪个页面最具权威性, 不能光看页面自己怎么说, 还要看其它页面怎么评价。 当一个关键词被搜索的时候,含有以关键词为链接文字的反向链接数目最多的那个文件或网页,将被作为最相关的结果排在前面 HITS 算法 1997,Jon Kleinber,Hyperlink-Induced Topic Search,“超链诱导主题搜索” /netacgi/nph-Parser?patentnumber=6,112,202 HITS 算法会提炼出两种比较重要的页面,也就是枢 纽页面和权威页面。 枢纽页面本身可能没有多少导入链接,但是有很多导出链接指向权威页面。 典型的枢纽页面就是如雅虎目录、开放目录或好123 这样的网站目录。这种高质量的网站目录 作用就在于指向其他权威网站,所以称为枢纽。 权威页面通常是提供真正相关内容的页面。权威页面本身可能导出链接不多,但是有很多来自枢纽页面的导入链接。而权威页面有很多导入链接,其中包含很多来自枢纽页面的链接。 HITS 算法 枢纽值(Hub Scores) 、权威值(Authority Scores) 枢纽值:页面上所有导出链接指向页面的权威值之和。 权威值:所有导入链接所在页面的枢纽值之和。 缺点:查询时间长 TrustRank算法 2004, 斯坦福大学和雅虎联合研究,2006年专利 基本假设:好的网站很少会链接到坏的网站 如果能挑选出可以百分百信任的网站,这些网站的TrustRank评为最高,这些trustRank最高的网站所连接的网站信任指数稍微降低,但也会很高。与此类似,第二层别信任的网站链接出去的第三层网站,信任度继续下降。离第一层网站点击距离越近,信任指数越高,反之亦反。 挑选种子网站,设定TrustRank值,挑选种子网站有两种方式: 一种是选择导出链接最多的网站; 另一种挑选种子网站的方法是选PR值高的网站。 两种计算TrustRank随链接关系减少的公式:一是随链接次数衰减;二是设置一个最低TrustRank值门槛。 TrustRank算法 影响网站TrustRank的因数 1.域名注册时间在五年或五年以上; 2.网站托管在专用服务器上; 3.网站加载时间快; 4.网站内容是原创的; 5.访客在每个网页的停留时间超过90秒; 6.网站被多个国际IP段引用; 7.网站在其所属行业中拥有权威性 G
文档评论(0)