- 1
- 0
- 约1.42万字
- 约 18页
- 2018-03-27 发布于河南
- 举报
基于超链接搜索策略网络爬行器的设计与实现_第四章爬行器的设计与实现_40_57
第四章 爬行器的设计与实现
第四章 爬行器的设计与实现
4.1 爬行器总体设计
构造爬行器有两种方式,第一种是把爬行器程序设计成为递归的程
序。第二种是编写一个非递归的爬行器程序,它维护一个要访问的网页列
表。当考虑使用哪一种方式时,要考虑是爬行器具有适于访问非常大的
Web 站点的功能。
4.1.1 递归程序
递归是在一个方法中调用它本身的程序设计技术。在某些项目中使用
递归构造爬行器是合理的方案。当需要重复做同样的基本任务或在处理先
前任务时,递归是相当有用的。以递归形式设计的爬行器程序的总体工作
过程的伪代码如下所示:
void Spider(String url)
{
Download URL
Parse URL
For each URL found
Call Spider(with found URL)
End for
Process the page just downloaded
}
在这一段代码中,查看单独的一个Web 页的任务放在一个称为Spider
的方法中。在此,调用 Spider 方法来访问一个 URL
您可能关注的文档
- 08测量操作手册.doc
- 中国肝病中成药市场运行态势与投资前景预测报告(2013-2017).doc
- 二单元3《村居.ppt
- 土字旁的字.docx
- 当选慈善总会会长的讲话.doc
- 公务员事业编高频地理考点.pdf
- ERP练习卷总账.doc
- 对高中生的戏剧素养要求.doc
- 心灵的欢歌1.doc
- 欣童项目可行性研究报告(2013年发改委评审方案设计)-专家免费咨询.pdf
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
原创力文档

文档评论(0)