Google爬虫如何抓取Javascript?.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Google爬虫如何抓取Javascript?.doc

标准化英文推广,标准化英文SEO,亿推标准化英文推广,亿推标准化英文SEO,亿推英文软文撰写,亿推英文推广,TuiGuang123 深圳市亿推信息技术有限公司是国内知名的英文搜索引擎排名、英文SEO、英文新闻稿发布,外贸营销推广机构。亿推依托强大的海外网络资源和合作伙伴网络,提供标准化的英文搜索推广解决方案,帮助企业或品牌拓展知名度、美誉度。   我们测试了谷歌爬虫是如何抓取JS,下面就是我们从中学习到的知识。   认为Gooe不能处理JS?再想想吧。eeee分享了一系列测试结果,他和他同事测试了什么类型的JS功能会被Gooe抓取和收录。 “英文SEO亿推”   概述   .我们进行了一系列测试,已证实Gooe能以多种方式执行和收录JS。我们也确认Gooe能渲染整个页面并读取DOM,由此能收录动态生成的内容。   .DOM中的“英文SEO亿推”信号(页面标题、e描述、o标签、eoos标签等)都被关注到。动态插入DOM的内容都也能被抓取和收录。此外,在某些案例中,DOM甚至可能比HTML源码语句更优先。虽然这需要做更多的工作,但这是我们好几个测试中的一个。   引言:Gooe执行JS读取DOM   早在年,Gooe就成功抓取JS,但很可能局限于某种方式。   而在今天,可以明确的是,Gooe不仅能制定出他们抓取和收录的JS类型,而且在渲染整个e页面上取得了显著进步(特别在最近的到个月)。   在Mee,我们的“英文SEO亿推”技术团队想更好地理解谷歌爬虫能抓取和收录什么类型的JSs事件。经过研究,我们发现令人瞠目的结果,并已证实Gooe不仅能执行各种JS事件,而且能收录动态生成的内容。怎么样做到的?Gooe能读取DOM。   DOM是什么?   很多搞“英文SEO亿推”的都不理解什么是DoeOeMoe(DOM)。 “英文SEO亿推”   当浏览器请求页面时会发生什么,而DOM又是如何参与进来的。   当用于e浏览器,DOM本质上是一个应用程序的接口,或PI,用于标记和构造数据(如HTML和XML)。该接口允许e浏览器将它们进行组合而构成文档。   DOM也定义了如何对结构进行获取和操作。虽然DOM是与语言无关的PI(不是捆绑在特定编程语言或库),但它普遍应用于e应用程序的JS和动态内容。   DOM代表了接口,或“桥梁”,将e页面与编程语言连接起来。解析HTML和执行JS的结果就是DOM。e页面的内容不(不仅)是源码,是DOM。这使它变得非常重要。 “英文SEO亿推”   JS是如何通过DOM接口工作的。   我们兴奋地发现Gooe能够读取DOM,并能解析信号和动态插入的内容,例如e标签、页面文本、e标签和e注解(如:e=o)。可阅读其中的完整细节。   关于这一系列测试、及结果   因为想知道什么样的JS功能会被抓取和收录,我们单独对谷歌爬虫创建一系列测试。通过创建控件,确保URL活动能被独立理解。下面,让我们详细划分出一些有趣的测试结果。它们被分为类:   JS重定向   JS链接   动态插入内容   动态插入Me数据和页面元素   一个带有e=“ooo”的重要例子 “英文SEO亿推”   例子:一个用来测试谷歌爬虫理解JS能力的页面。   .JS重定向   我们首先测试了常见的JS重定向,用不同方式表示的URL会有什么样结果呢?我们选择了o.oo对象进行两个测试:Tes以绝对路径URL调用o.oo,而TesB使用相对路径。   结果:该重定向很快被Gooe跟踪。从收录来看,它们被解释为-最终状态的URL取代了Gooe收录里的重定向URL。   在随后的测试中,我们在一个权威网页上,利用完全相同的内容,完成一次利用JS重定向到同一个站点的新页面。而原始URL是排在Gooe热门查询的首页。   结果:果然,重定向被Gooe跟踪,而原始页面并没有被收录。而新URL被收录了,并立刻排在相同查询页面内的相同位置。这让我们很惊喜,以排名的角度上看,视乎表明了JS重定向行为(有时)很像永久性的重定向。   下次,你的客户想要为他们的网站完成JS重定向移动,你可能不需要回答,或回答:“请不要”。因为这似乎有一个转让排名信号的关系。支持这一结论是引用了Gooe指南:   使用JS为用户进行重定向,可能是一个合法的做法。例如,如果你将已登录用户重定向到一个内部页面,你可以使用JS完成这一操作。当仔细检查JS或其他重定向方法时,以确保你的站点遵循我们的指南,并考虑到其意图。记住重定向跳转到你网站下是最好的,但如果你没有权限访问你网站服务器,你可以为此使用JS重定向。   .JS链接   我们用多种编码方式测试了不同类型的JS链接。   我们测试下拉菜单的链接。历史上的搜素引擎一直不能跟踪这类型的链接。我们想确定oe事件处理器是否会被跟

文档评论(0)

dmz158 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档