数据采集-精品·公开课件.pptVIP

  • 21
  • 0
  • 约9.52千字
  • 约 68页
  • 2018-11-05 发布于广西
  • 举报
* * * * * * * * * * 详细功能介绍 详细功能介绍 详细功能介绍 详细功能介绍 详细功能介绍 谢谢! Thank! * * * * * * * * * * * * * * * * * * * * * * * * * * 火车采集器数据发布原理 火车采集器如何去抓取数据,取决于您的规则。您要获取一个栏目的网页里的所有内容,需要先将这个网页的网址采下来,这就是采网址。程序按您的规则抓取列表页面,从中分析出网址,然后再去抓取获得网址的网页里的内容。再根据您的采集规则,对下载到的网页分析,将标题内容等信息分离开来并保存下来。如果您选择了下载图片等网络资源,程序会对采集到的数据进行分析,找出图片,资源等的下载地址并下载到本地。 火车采集器抓取原理 在我们将数据采集下来后数据默认是保存在本地的,我们可以使用以下几种方式对数据进行处理。 1、不做任何处理。因为数据本身是保存在数据库的(access、db3、mysql、sqlserver),您如果只是查看数据,直接用相关软件打开查看即可。 2、Web发布到网站。程序会模仿浏览器向您的网站发送数据,可以实现您手工发布的效果。 3、直接入数据库。您只需写几个SQL语句,程序会将数据按您的SQL语句导入到数据库中。 4、保存

文档评论(0)

1亿VIP精品文档

相关文档