数据采集技术 课件 任务5.2 编写Spider脚本任务.pptx

数据采集技术 课件 任务5.2 编写Spider脚本任务.pptx

编写spider脚本任务——数据采集技术

项目采集目识点使用Scrapy的Item类封装数据编写spider脚本任务字段验证

项目采集目标01

项目采集目标项目采集的目标数据是数字教材_人大芸窗数字教材(/szjc/Index.html)中课程推荐的教材名称、作者、ISBN号码,具体如下图所示。

使用Scrapy的Item类封装数据02

我们一般需要定义一个继承自scrapy.Item的子类,并在该子类中添加类型为scrapy.Filed的类属性。每个类属性代表要采集的数据字段,如我们提到的教材名称、作者、I

文档评论(0)

1亿VIP精品文档

相关文档