原创与站内权重继承算法补充.docVIP

  • 0
  • 0
  • 约1.27千字
  • 约 3页
  • 2018-03-07 发布于河南
  • 举报
原创与站内权重继承算法补充

之前看到搜索引擎原创识别与站内权重继承算法解析这篇文章,写的很好,但对于普通水平的同学来说很难理解,同时也有一部分算法未提及。 对于原创的识别上,原文提到的提取关键词,然后运用md5或者频率对比的方式是可以的,但实际运用起来可能效果不是很好。在搜索引擎对原创内容识别上,按照关键词词频(TF)的比较闲的有些低级,应为内容太多,很容易出现误判的情况。所以,还需要另一个指标来判断。这种方法就是切片比较,按照固定步长对内容进行切片,比较其相似度,会更接近于真实结果。切片比较可以很好的识别段落打乱的伪原创手法。 页面降噪技术搜索引擎使用的很广泛,对于大部分标题+正文的内容,都可以用降噪技术来获得接近于真实内容的内容。那么,我们在SEO优化中就需要在正文中间加入干扰因素来 打断搜索引擎的提词、切片。加入的内容可以使锚文本链接、也可以使相关的一段话。同时,这种手法同样可以打乱搜索引擎的向量化处理。 原文中还提高了站内权重继承问题。站内的页面权重继承并非像原文作者说的那样简单,权重分配也并非简单的平均分配。同时,为了防止一个网站通过短时间内大量制造内链来提高自身权重的问题,在站内权重传递过程中还会加入一个阻尼基数,这个阻尼基数一般为0.15。也就是说,如果一个页面有一百个导出链接,会有其中的15个链接不会参与到权重的传递。按照链接出现的位置,各个位置的链接所获得的权重继承

文档评论(0)

1亿VIP精品文档

相关文档