SEM专业术语1.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SEM专业术语1

SEM专业术语 原理篇 全文搜索引擎是目前广泛应用的主流搜索引擎。 它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。 最常用的全文搜索引擎有百度、谷歌(Google)等。 2、元搜索引擎(METASearchEngine) 元搜索引擎、聚合搜索都是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。 3、目录搜索引擎 目录搜索引擎虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。 用户完全可以按照分类目录找到所需要的信息。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。 如早期的雅虎、搜狐。而hao123 导航网站虽然功能相近,但严格意义上来说并不算目录搜索引擎,仅仅是按目录分类的网站链接列表而已。 4、网页蜘蛛(Spider) 网页蜘蛛(又被称为网络爬虫,网络机器人,搜索引擎蜘蛛),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。 5、蜘蛛陷阱(Spidertrap) “蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,通常是那些显示网页的技术方法,目前很多浏览器在设计的时候考虑过这些因素,所以可能网页界面看起来非常正常,但这些蜘蛛陷阱会对蜘蛛程序造成障碍,如果消除这些蜘蛛陷阱,可以使蜘蛛程序收录更多的网页。 6、抓取频次 抓取频次是搜索引擎在单位时间内(天级)对网站服务器抓取的总次数,如果搜索引擎对站点的抓取频次过高,很有可能造成服务器不稳定,Baiduspider 会根据网站内容更新频率和服务器压力等因素自动调整抓取频次。 7、搜索请求(Query) 搜索请求,又被称作搜索查询,指用户在搜索引擎键入某个关键词搜索并试图取得返回结果的过程。搜索请求代表查询者的搜索意图。 8、索引(Index) 俗称“预处理”。蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程即是索引。 在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。 9、站点索引量 站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。 站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。 页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。 目前 site 语法的数值是索引量估算值,比较不准。推荐站长们使用我们的新工具,同时我们也正在努力改进site 语法。 10、建库 为新索引网页建立索引库。 我们在判断网页收录的时候常常会分为两种情况,第一种就是搜索网页链接;第二种就是我们直接搜索网页标题。 当出现搜索引擎只收录了网页链接而搜索标题找不到链接时,我们称作“该网页未建库”,就是搜索引擎发现了你的 URL,但是却没有将其放入索引中。 在这种情况下,你搜索任何和该网页相关的 Query,都无法使网页出现在搜索结果中,除了搜索 URL 本身。 11、底层库 底层库是什么,就是备胎! 你的女神有 50W 个男友,你是50W 位置后的备胎。 怎么能转正呢?等 50W 里死掉一大半,估计你机会来了。 不能参与排名的都在底层库里。 所以,想要信息不被放入到底层库,一是要有足够的影响力,百度不敢忽视你,比如新浪网易之类的,就算发个广告,度娘也乖乖的索引起来,作为正式男友,不敢当备胎。二是要有新颖的内容,度娘也喜新厌旧,好东西当然不会错过。 12、网页快照 搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider 系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。 13、网站权重(PageStrength) 网站权重是指搜索引擎给网站(包括网页)赋予一定的权威值,对网站(含网页)权威的评估评价。 一个网站权重越高,在搜索引擎所占的份量越大,在搜索引擎排名就越好。其中有几点需要注意: A、权重不等于排名 B、权重对排名有着非常大的影响 C、整站权重的提高有利于内页的排名。 14、网站降权(Rightdown) 利用搜索引擎策略缺陷,以恶意手段获取与网页质量不符排名,而引发搜索结果和用户体验下降的行为都会被搜索引擎视为作弊行为,作弊应为按照“轻者轻罚,重者重罚”原则: 对用户体验及搜索结果质量影响不大的,去除作弊部分所获权值,对用户体验及搜索结果质量影响严重的,去除作弊部分所获权值并降低网站权重,直至彻底清理出搜索结果。 15、K 站 俗称“拔毛”。所谓百度

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档