- 6
- 0
- 约2.59万字
- 约 48页
- 2017-08-09 发布于辽宁
- 举报
JIU JIANG UNIVERSITY
毕 业 论 文
题 目 网络爬虫技术探究英文题目 Web Spiders Technology Explore 院 系 信息科学与技术学院
专 业 计算机科学与技术
姓 名 闻泽
班级学号 A081129
指导教师 邱兴兴
二一二年五月摘 要
网络爬虫是一种自动搜集互联网信息的程序。通过网络爬虫不仅能够为搜索引擎采集网络信息,而且可以作为定向信息采集器,定向采集某些网站下的特定信息,如招聘信息,租房信息,以及网络营销常要的邮箱地址信息等。
本文通过JAVA实现了一个基于广度优先算法的爬虫程序。本论文阐述了网络爬虫实现中一些主要问题:为何使用广度优先的爬行策略,以及如何实现广度优先爬行;系统实现过程中的数据存储;网页信息解析等。
通过实现这一爬虫程序,可以搜集某一站点的所有URLs,并通过得到的URLs采集到页面的内容,在从内容中提取到需要的内容,如邮箱地址以及页面标题等。再将得到的URLs等采集到数据存到数据库,以便检索。本文从搜索引擎的应用出发,探讨了网络爬虫在搜索引擎中的作用和地位,提出了网络爬虫的功能和设计要求。在对网络爬虫系统结构和工作原理所
您可能关注的文档
- 燃煤锅炉烟气氨法脱硫工程建议书.doc
- 热能与动力工程文献翻译-热电厂发展的趋势(节选).doc
- 人力资源【学士学位论文】.doc
- 人力资源管理(毕业设计论文)文献翻译-学习与发展,一个策略性人力资源发展计划.doc
- 日本艺术和动画卡通【外文翻译】.doc
- 如何解决快递业_爆仓_问题的研究(毕业设计论文).doc
- 三通管注塑模设计-纺织大学(毕业设计论文).doc
- 三相四桥臂逆变器仿真研究(毕业设计论文).doc
- 厦门中亚城建议书.doc
- 山东省圣源实业公司财务风险管理存在的问题及其改进措施-—.doc
- 2026届高考英语二轮复习高频考点增分提升练 模块五 介词(共2份 含解析).docx
- 湘教版八年级下册数学全册教学课件(新教材).pptx
- 2025第十三届全国湿法冶金工程技术交流会:实验室仪器分析技术在湿法冶金中的标准化实践.docx
- 2025第十三届全国湿法冶金工程技术交流会:湿法冶金和新能源行业氨氮废水资源化技术及应用.docx
- 2025第十三届全国湿法冶金工程技术交流会:面向绿色冶金未来的应用型技术突破.docx
- 2025第十三届全国湿法冶金工程技术交流会:络合-剪切诱导解络-超滤分离稀土.docx
- 2025第十三届全国湿法冶金工程技术交流会:二次铝灰机械活化碱浸除氨氟及制备冰晶石研究.docx
- 2025第十三届全国湿法冶金工程技术交流会:浆态床加氢设备外排油渣中钼和钒的回收工艺研究.docx
- 《城市建设档案管理规定》解读.pdf
- 《水电工程退役评估导则》.pdf
最近下载
- 南京中医药大学2024-2025学年第1学期《宏观经济学》期末考试试卷(B卷)附标准答案.pdf VIP
- 热力管道试压技术交底(标准范本).docx VIP
- 2025年甘肃省西北民族大学专职辅导员招聘考试真题.docx VIP
- 2.4基于手机传感器对单摆测重力加速度实验的改进课件高二上学期物理教科版选择性.pptx
- 人教版二年级劳动下册全册教学课件.ppt
- 智慧寺庙解决方案.docx VIP
- 两栖类解剖生理第15讲两栖类18课件.pptx VIP
- 脑出血患者护理方案与康复指导.docx VIP
- 毕业设计(论文)-混凝土面板堆石坝及溢洪道设计说明书及计算书.doc VIP
- 2024年高考真题江苏卷化学试题(解析版).docx VIP
原创力文档

文档评论(0)