- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山东财经大学
本科毕业论文(设计)
题目:基于JAVA的搜索引擎设计与实现
学 院 计算机科学与技术
专 业 计算机科学与技术专业
班 级 计算机科学与技术2班
学 号 20080854239
姓 名 秦 露
指导教师 林培光
山东财经大学教务处制
二O一二年五月
山东财经大学学士学位论文原创性声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在论文中作了明确的说明并表示了谢意。本声明的法律结果由本人承担。
学位论文作者签名:
年 月 日
山东财经大学关于论文使用授权的说明
本人完全了解山东经济学院有关保留、使用学士学位论文的规定,即:学校有权保留、送交论文的复印件,允许论文被查阅,学校可以公布论文的全部或部分内容,可以采用影印或其他复制手段保存论文。
指导教师签名: 论文作者签名:
年 月 日 年 月 日
基于JAVA的搜索引擎设计与实现
摘 要
网络中资源丰富,但是互联网上海量的信息,任何一个人都不能全部浏览,为了获取我们需要的信息,由此就产生了搜索引擎。而如今搜索引擎无法满足增长着的网页数量,搜索引擎技术已经成为计算机界积极研究和开发的对象,网络爬虫是搜索引擎的基础,是最底层的技术。所以研究网络爬虫的实现技术并研究其应用十分重要。论文详细说明了如何用java语言实现一个简易搜索引擎,同时描述了搜索引擎的原理,系统功能,简要介绍了系统开发的背景,开发环境,系统的需求分析,以及功能的设计与实现。
关键词:搜索引擎;网络爬虫;搜索策略
Design and Implementation of Search Engine Based on JAVA
ABSTRACT
The resources on the internet are abundant, but any one of us cant browse the great quantity information on the Internet, so the search engine appeared to obtain the information which we need. However, search engines can not meet the growth in the number of pages nowadays. Search engine technology has become the object of active research and development of computer industry. Web crawler is the foundation of all and this is the underlying technology. So it is very important to develop the Web crawler technology, also it is very important to study the application of the Web crawler technology. This paper details how to implement a simple search engine with java language, describes the principle of the search engine, system functions, and briefly introduces the background of the system development, development environment, requirements analysis, and functional designation and implementation.
Keywords:Search engineWeb spider; Search strategy
目 录
一、引言 1
二、搜索引擎 1
(一)搜索引擎的工作原理 1
(二)搜索引擎的分类 1
(三)搜索引擎技术发展 2
三、网络爬虫知识储备 2
(一)深入学习URL 3
(二)指定URL获取网页 3
(三)爬虫策略 4
您可能关注的文档
- 基于三网融合商务新模式的探讨.doc
- 基于单片机实现的数字转速表的设计.doc
- 基于单片机的数字时钟课程设计.doc
- 基于VF实现的学生综测管理系统.doc
- 基于plc的自动售货机设计工控组态软件控制设计.doc
- 基于单片机的无刷直流电动机的调速控制.doc
- 基于三菱FX1S PL模拟工业控制轧钢机的工作过程.doc
- 基于PLC交通灯控制系统的设计.doc
- 基于C均值(K均值)对数据进行聚类分析.doc
- 基于GARCH模型的香港股指期货市场研究.doc
- 2024-2025学年安徽省亳州市涡阳县高二下学期2月开学考试政治试题(解析版).docx
- 2024-2025学年江西省赣州市上犹县高二下学期开学考试政治试题(解析版).docx
- 2024-2025学年山东省济宁市高二下学期开学考试政治试题(解析版).docx
- 2024-2025学年山西省卓越联盟高三下学期2月开学质量检测政治试题(解析版).docx
- 2024-2025学年新疆乌鲁木齐市高二下学期2月开学考试政治试题(解析版).docx
- 2024-2025学年新疆维吾尔自治区乌鲁木齐地区高三2月大联考文科综合政治试题(解析版).docx
- 2024-2025学年安徽省蚌埠市固镇县高一上学期1月期末考试政治试题 (解析版).docx
- 2024-2025学年江苏省扬州市高三上学期期末检测政治试卷(解析版).docx
- 2024-2025学年江西省吉安市高三上学期期末教学质量检测政治试题(解析版).docx
- 2024-2025学年山东省济宁市高二上学期1月期末考试政治试题(解析版).docx
文档评论(0)