基于VectorSpace模型的关键词实战.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于VectorSpace模型的关键词实战.doc

在关键词分布策略的排名方面,除了站外的锚链接促进排名以外,剩余比较重要的因素就是网站内部中的密度和分布策略了。 在之前的《TF-IDF算法在SEO中的衍生应用》一文章中,谈到一个与密度和词频有关的算法,叫做TF-IDF。很多朋友说这篇文章依然比较深,不知道如何入手。这里我们结合该一下Vector Space Model模型,用实战来讲解关键词分布策略,由于Vector Space Model的复杂性,我对该模型就不做额外的介绍了,有兴趣的朋友可以自己查询。 同时为了方便我的博友查询词的权重情况,我做了一个excel表格,可以下载后自行更改查询关键词权重,找到最佳密度策略。 这里我们首先设定几个条件: 1.实战针对谷歌,因为谷歌对锚链接给予的权重比较低,方便我们做测试。 2.实战采用的关键词分布策略这个长尾和本页面做为案例 3.实战对比的网页是:www.***.cc/blog/lanzhouseo/keywords-fenbu/ 。该网页目前在谷歌中排名第三 在不对两个网页进行任何外链促进排名的情况下,看最终排名结果(实际中上面网页中的内容已经被转发多次,积累了一定的页面权重) 4.Google的总收录量为100亿 一、分词 我们首先将该长尾区分为关键词、分布和策略三个词。搜索引擎中的分词方式可能与我们实际主观理解的不同。但为了讲解这个理念和进行这个实战,我们暂且将该长尾分为以上三个词。 分词后我们查询竞争对手的网页,得到词频数分别为: 关键词:40次 分布:16次 策略:5次 (注:这里推荐使用《Lynx浏览器在线版》先对页面进行l到文本的转换,然后使用ctrl+f进行查找即可方便的查询多个关键词的词频)。 二、计算权重 结合TF-IDF算法我们分析出: 这里我们得到了竞争对手在以上长尾中的权重总得分,为3.2286。接下来我们要对我们的关键词密度做一个优化处理。 这里我帮大家做了一个excel表格,大家可以下载。表格分上下两部分,上面部分可以填入竞争对手的情况,下面部分可以输入自己网站的情况。然后将总分值进行对比,找到符合自己网站的最佳关键词密度。 这里我略过算法部分,直接出结论:关键词、分布、策略这三个词,每个词出现14次,或一起出现14次,是最优密度,权重得分为4.0126,如果再多,就会出现权重下降的情况。(其实按照算法,如果一起作为一个短语出现,即使只同时出现1次,也是同样的得分。但往往我们在网页内容创作时无法做到同时出现,所以要分别计算关键词权重以及他们的总权重)。 下载:词权重查询表 三、分布 关于基于算法的策略,我们首先应该确定有几个地方必须出现: * 标题(完全匹配出现) * 描述(匹配出现) * 正文第一段落(最好完全匹配出现) * 正文最后段落 其次我们应该确定还有些地方应该出现: * 正文自然分布(可以不完全匹配) * 图片alt描述(完全匹配出现) 由于我是一边写作一边进行测试,现在查询了一下次数,已经全部超标。于是回头修改一下。其他朋友可以确定自己需要在文章中出现的次数,然后再进行写作,这样会容易和简单一些。 最后值得注意的一点就是,在密度方面我们要掌握好词频的上限。一般来说掌握在15次以下为佳。再多有堆砌作弊的嫌疑。 以上就是我在内容创作时采用的基于TF-IDF算法和Vector Space模型而采用关键词密度和分别策略。一般而言,该关键词策略对谷歌有非常好的效果(比如假象做为竞争对手的那个页面,已经排在第三)。而对于百度来讲,更注重关键词的锚文本外链。但无论如何,我们要先赢在基础和细节上。SEO本来就是一项关乎于网站细节的工作。 网络推广 事件炒作 H6M9

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档