- 11
- 0
- 约2.59万字
- 约 48页
- 2016-05-16 发布于辽宁
- 举报
网络爬虫技术探究 本科生毕业设计论文
JIU JIANG UNIVERSITY
毕 业 论 文
题 目 网络爬虫技术探究英文题目 Web Spiders Technology Explore 院 系 信息科学与技术学院
专 业 计算机科学与技术
姓 名 闻泽
班级学号 A081129
指导教师 邱兴兴
二一二年五月摘 要
网络爬虫是一种自动搜集互联网信息的程序。通过网络爬虫不仅能够为搜索引擎采集网络信息,而且可以作为定向信息采集器,定向采集某些网站下的特定信息,如招聘信息,租房信息,以及网络营销常要的邮箱地址信息等。
本文通过JAVA实现了一个基于广度优先算法的爬虫程序。本论文阐述了网络爬虫实现中一些主要问题:为何使用广度优先的爬行策略,以及如何实现广度优先爬行;系统实现过程中的数据存储;网页信息解析等。
通过实现这一爬虫程序,可以搜集某一站点的所有URLs,并通过得到的URLs采集到页面的内容,在从内容中提取到需要的内容,如邮箱地址以及页面标题等。再将得到的URLs等采集到数据存到数据库,以便检索。本文从搜索引擎的应用出发,探讨了网络爬虫在搜索引擎中的作用和地位,提出了网络爬虫的功能和设计要求。在对网络爬虫系统结构和工作原理所
您可能关注的文档
- 年产16万吨阴极铜铜电解车间设计本科生毕业设计论文任务书.doc
- 年产60万熟料生产线和42.5普通硅酸盐水泥的熟料烧成车间设计大学生学位论文.doc
- 年产85万吨对二甲苯设计本科生毕业设计论文.doc
- 年产120万吨冷轧车间设计本科生毕业设计论文.doc
- 年产130万吨连铸坯的电弧炉炼钢车间设计大学生学位论文.doc
- 年产300万升—黄秋葵浓缩液—建设项目立项可行性分析论证报告.doc
- 年产2000吨发酵豆奶工厂设计本科生毕业设计论文.doc
- 年产3000t乳酸菌泡菜加工厂设计—食品科学大学生学位论文.doc
- 柠檬酸钙制备的研究本科生毕业设计论文.doc
- 年产50000吨食用酒精工厂的初步设计本科生毕业设计论文.doc
最近下载
- 2023年中国南水北调集团青海有限公司招聘笔试真题.docx VIP
- 2025年新疆维吾尔自治区、新疆生产建设兵团中考道德与法治真题(原卷版).pdf VIP
- 《龙游黄茶(征求意见稿)》团体标准编制说明.docx VIP
- 立式加工中心换刀机械手.doc VIP
- 衢州味道 龙游乌猪肉.pdf VIP
- 2023年中国南水北调集团青海有限公司招聘考试真题及答案.docx VIP
- ZONCN众辰NZ100中文折页说明书用户手册.pdf
- 16J934-3 中小学校建筑设计常用构造做法.docx VIP
- 高中历史合格考《中外历史纲要》上下册知识点速记.pdf VIP
- 城市公共交通调度与运营管理.docx VIP
原创力文档

文档评论(0)