《商务数据采集与处理》课件 第6节:XPath应用.pptxVIP

  • 3
  • 0
  • 约小于1千字
  • 约 9页
  • 2026-06-10 发布于山东
  • 举报

《商务数据采集与处理》课件 第6节:XPath应用.pptx

八爪鱼数据采集课程第6节:XPath应用

自定义抓取理解网页上的数据类型十分丰富:文本、图片、链接、源码等。在数据采集过程中,不同类型的数据类型,对应的抓取方式是不同的。本文将讲解常见的数据类型与其抓取方式。

自定义抓取需求:采集图片地址示例网址:/explore#!type=movietag=%E7%BB%8F%E5%85%B8sort=recommendpage_limit=20page_start=0Step1.在字段中选择【元素抓取方式】Step2.鼠标选中页面中的图片,在弹出的操作提示框中选择【采集该图片地址】

数字翻页常用Xpathfollowing-sibling::a选取当前节点之后的所有同级a节点(可替换为其他标签),常用于数字翻页示例网址:/tag/%E7%AB%A5%E8%AF%9D

数字翻页需求:设置翻页示例网址:/news/Step1.先定位到当前页;再定位到当前页的下一页Step2.在八爪鱼中创建一个【循环翻页】,将写好的XPath://span[@class=thisclass]/following-sibling::a[1],复制到【单个元素】后面的文本框中,点击【确定】保存。

实战演练:采集列表页的数据并翻页数据源网站搜索关键词:机器人,采集所有机器人商品主图+轮播图链接采集需求【商品标题】、【商品链接】、【主图+

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档