- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业设计教师用表Web搜索引擎的设计与实现.pdf
2012 届学生毕业设计 (论文)前期工作材 料 理工类 题 目: Web 搜索引擎的设计与实现 学 院 : 电子工程学院 专业班级 : 电子信息工程 电子xxx 学生姓名 : 学 xxxxx Xxxxx 号: 指导教师 : 杨 瑞 (副教授) 材 料 目 录 序 号 名 称 数 量 备 注 1 毕业设计 论文 选题、审题表 1 2 毕业设计 论文 任务书 1 3 毕业设计 论文 开题报告〔含文献综述〕 1 4 毕业设计 论文 中期检查表 1 5 毕业设计 论文 外文资料翻译〔含原文〕 1 学院意见: 学院 (公章 ) 年 月 日
2012 年 月 淮海工学院毕业设计(论文)选题、审题表 申报课题名称 Web 搜索引擎的设计与实现 专业技术 指导教师 杨瑞 副教授 职 务 A B C D E A B C D 课题性质 课题来源 √ √ 课题预计 大 适中 小 课题预计 难 一般 易 工作量 √ 难易程度 √ 本系统实现一个WEB 搜索引擎,在研究搜索引擎基本原理、 架构设计和核心技术的基础上,结合小型搜索引擎的需求,构建 课题简介 一个运行稳定,性能良好而且可扩充的小型搜索引擎系统,实现 网络爬虫,信息处理,排序索引,搜索等基本功能。系统将采用 Java+Lucene+Jsp 结构开发。另外,对该系统的安全性、可靠性 、 公正性也做了相应的考虑。 1. 网上查询不少于10 份相关的资料和文档。 设计 论文 2. 设计出具备完善功能的系统软件 要 求 3. 具有良好的人机界面 4. 具有简洁的操作 (包括应具 5. 书写出规范的设计论文 备的条件) 6. 参加该设计的学生需要有数据库、WEB 程序设计等方面的 基础知识。 系审定意见: 系主任 签名 : 年 月 日
注:1. 该表作为毕业生毕业设计(论文)课题申报时专用,由选题教师填写,经系有关人员讨论,负责人签名
后生效。2. 有关内容的填写见填表说明,并在表中相应栏内打“√”。3. 课题一旦被学生选定,此表须放在学生 “毕业设计(论文)资料袋”中存档。4. 填表说明:(1)该表的填写只针对1 名学生做毕业设计(论文)时选
择使用,如同一课题由2 名及2 名以上同学选择,应在申报课题的名称上加以区别(加副标题),并且在“设计 (论文)要求”一栏中加以体现;(2 )“课题性质”一栏,A.工程设计,B.理论研究,C.实验研究,D.计算机软
件,E.综合论文;(3 )“课题来源”一栏:A.指导教师的科研课题,B.指导教师收集的科研和生产实际中的课题,
C.学生在科学活动和工程实践中自立的课题,D. 自拟课题;(4 )“课题简介”一栏:主要指研究设计该课题的背
景介绍及目的、意义。5. “设计(论文)要求(包括应具备的条件)”一栏:主要指本课题技术方面的要求,而“条
件”指从事该课题必须应具备的基本条件 如仪器设备、场地、文献资料等 。 淮海工学院毕业设计(论文)任务书 题 目 Web 搜索引擎的设计与实现 学 院 电子工程学院 专业班级 电子信息工程 xxxx 学生姓名 学 号
1.毕业设计 (论文)应达到的目的 网络的迅猛发展,使得信息的搜索变得越来越重要,通用搜索引擎成为了
人们上网寻找信息不可或缺的工具。本课题在研究搜索引擎基本原理、架构设
计和核心技术的基础上,结合小型搜索引擎的需求,构建一个运行稳定,性能
良好而且可扩充的小型搜索引擎系统,实现网络爬虫,信息处理,排序索引,
搜索等基本功能。通过该系统的设计还可以提高学生的实践和动手能力使学生
能将理论和实际相结合,拓展学生的知识面,使学生在数据库、算法及程序设
计、网络通信、XML 技术等方面的能力都有质的提高。对学生适应将来的工作
岗位具有现实意义。
2.毕业设计(论文)的内容和要求〔包括原始数据、技术要求、工
作要求等〕 本课题在研究搜索引擎基本原理、架构设计和核心技术的基础上,结合小
型搜索引擎的需求,构建一个运行稳定,性能良好而且可扩充的小型搜索引擎
系统,实现网络爬虫,信息处理,排序索引,搜索等基本功能。本系统的主要
实现功能: 1.爬虫功能:利用Heritrix 来实现网络爬虫,并采用数据库来存储 url。 2.网页的内容解析:使用htmlparse 进行网页的处理与分析。 3.中文分词处理:参照lucene 的切词原理,对词库进行了一个细分,并 且在程序中能够对细分的词库进行准确的定位,。 4.排序索引功能:参照了lucene 的排序索引原理,使用了倒排序原理将 各个词语相关的url 进行排序。 5.搜索优化功能:对搜索页面存储和对经常搜索词语的相关 url 的存储
两级缓存策略的方式来提高了系统的效率。 本系统将借Jav
文档评论(0)