- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我的计算机导论论文
院 系: 计算机与信息学院
专 业: 计算机科学与技术
年 级:
学生姓名:
学 号:
指导教师:
网页反作弊
一、引入与介绍
随着互联网的飞速发展,网络上的信息也成爆炸式增长。由于动态网页的使用和web2.0的普及,真实的网页数目更是难以估算。在如此多的网页中查找信息,搜索引擎成为了人民的首选。搜索引擎也是发现新网站的主要途径。我国的4.2亿网民中有76.3%声称搜索引擎是他们经常使用的网络服务。在对大规模搜索引擎用户的日志分析之后,发现80%只能查看返回结果的第一页。也就是排名在前十的页面。所以如果想获得更高的商业利润、只能使自己的网页在搜索结果中排在更靠前的位置。正是这些原因激发了网页作弊、由此推动了网页反作弊的发展。简言之、网页反作弊就是针对网页作弊所提供的一种手段和方法。
二、网页作弊介绍
?出于商业利益考虑,许多网站站长会针对搜索引擎排名进行分析,并采取一些手段将网页的搜索排名提高到与其质量不相称的位置。目前常见的作弊方法包括:内容作弊、链接作弊和隐藏作
(1)内容作弊
内容作弊的目的是通过精心更改或者调控网页内容,使得网页在搜索引擎排名中获得与其网页不相称的排名。搜索引擎排名算法一般包括内容相似性计算和链接重要性计算,内容作弊就是通过提高内容相似性计算的得分而获得最终的高排名。其实质是故意加大目标词的词频。常见的内容作弊方式有以下几种:
1、? 关键词重复
对于作弊者关心的目标关键词,大量重复设置在页面内容中。因为词频是搜索引擎相似度计算中必然会考虑的因子,关键词重复本质上是通过提高目标关键词的词频来影响搜索引擎内容相似性排名的
2、无关查询词作弊为了够尽可能多地吸引搜索流量,作弊者在页面内容中增加很多和页面主题无关的关键词,这本质上也是一种词频作弊,即将原来词频为0的关键词提升为非0
3、? 图片alt标签文本作弊
alt标签原本是作为图片的描述信息来使用的,一般不会在HTML页面显示,除非用户将鼠标放在图片上。但是搜索引擎会利用这个信息,所以有些作弊者将alt标签的内容以作弊的词汇来填充,达到吸引更多搜索流量的目的
4、? 网页标题作弊
网页标题作为描述网页内容的综述性信息,对于判断一个网页所讲述的主题是非常重要的启发因素,所以搜索引擎在计算相似性得分时,往往会增加标题词的权重。作弊者利用这一点,将与网页主题无关的目标词重复放在标题位置来获得较高的排名
5、? 网页重要标签作弊
网页不像普通文本格式,是带有HTML标签的,而有些标签代表了强调内容重要性意义,比如加粗标记b/b,段落标题h/h,字体大小标记等。搜索引擎一般会利用这些信息进行排序,因为这些标记因素能够更好地体现网页的内容所表现主题信息。作弊者通过在这些重要位置插入作弊关键词也能影响网页的排名、
6、? 网页元信息作弊
网页元信息,比如网页的内容描述区(Meta Description)和网页内容关键词区(Meta Description)是提供制作网页的人对网页主题信息进行简短描述的,同以上情况类似,作弊者可以在其中插入作弊词
7、? 内容农场
内容农场是通过廉价雇佣大量自由职业者,支持他们付费写作,但是写作内容普遍质量低下,很多文章是通过简单的复制粘贴完成的,但是他们会研究搜索引擎的热门搜索词,并有机地将这些词汇添加到写作内容中。这样普通搜索引擎用户在搜索时就会被引入到内容农场网站,通过大量低质量内容吸引流量而赚取高额的广告费。与传统的内容作弊方式不同,内容农场不采用机器重复单词等方式而是雇佣人员写作。
(2)链接作弊
所谓链接作弊,是网站拥有者考虑到搜索引擎排名中利用了链接分析技术计算网页质量,所以通过操作页面之间的链接关系或者操作页面之间的链接锚文字,以此来增加链接数量来提升网页排名的策略,主要方式有以下几种:
1、? 链接农场
链接农场构建了大量相互紧密链接的网页集合,期望能够利用搜索引擎链接算法的机制来提高排名。链接农场内的页面链接密度极高,任意两个页面都可能存在互相指向的链接。
2、锚文字作弊
作弊者通过精心设置锚文字内容来诱导搜索引擎给予目标网页较高排名,一般作弊者设置的锚文字和目标网页没有任何关系
3、? 交换友情链接
作弊者通过和其他网站之间交换链接,互相指向对方的网页页面,以此来增加排名。很多作弊者过分地使用此手段,但是并不意味着使用这个手段的都是作弊行为,交换友情链接的做法也是正常网站的常规措施
4、?购买链接
有些作弊者会通过购买链接的方法
文档评论(0)