- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012 届学生毕业设计(论文)前期工作材料
理工类
题 目: Web搜索引擎的设计与实现 学 院: 电子工程学院 专业班级: 电子信息工程 电子xxx 学生姓名: xxxxx 学 号: Xxxxx 指导教师: 杨 瑞(副教授)
材 料 目 录
序 号 名 称 数 量 备 注 1 毕业设计(论文)选题、审题表 1 2 毕业设计(论文)任务书 1 3 毕业设计(论文)开题报告〔含文献综述〕 1 4 毕业设计(论文)中期检查表 1 5 毕业设计(论文)外文资料翻译〔含原文〕 1 学院意见:
学院(公章 )
年 月 日
2012年 月淮海工学院毕业设计(论文)选题、审题表
申报课题名称 Web搜索引擎的设计与实现 指导教师 杨瑞 专业技术
职 务 副教授 课题性质 A B C D E 课题来源 A B C D √ √ 课题预计
工作量 大 适中 小 课题预计
难易程度 难 一般 易 √ √ 课题简介
本系统实现一个WEB搜索引擎,在研究搜索引擎基本原理、架构设计和核心技术的基础上,结合小型搜索引擎的需求,构建一个运行稳定,性能良好而且可扩充的小型搜索引擎系统,实现网络爬虫,信息处理,排序索引,搜索等基本功能。系统将采用Java+Lucene+Jsp结构开发。另外,对该系统的安全性、可靠性 、公正性也做了相应的考虑。 设计(论文)
要 求
(包括应具
备的条件) 网上查询不少于10份相关的资料和文档。
设计出具备完善功能的系统软件
具有良好的人机界面
具有简洁的操作
书写出规范的设计论文
参加该设计的学生需要有数据库、WEB程序设计等方面的基础知识。 系审定意见:
系主任(签名):
年 月 日 注:1. 该表作为毕业生毕业设计(论文)课题申报时专用,由选题教师填写,经系有关人员讨论,负责人签名后生效。2. 有关内容的填写见填表说明,并在表中相应栏内打“√”。3. 课题一旦被学生选定,此表须放在学生“毕业设计(论文)资料袋”中存档。4. 填表说明:(1)该表的填写只针对1名学生做毕业设计(论文)时选择使用,如同一课题由2名及2名以上同学选择,应在申报课题的名称上加以区别(加副标题),并且在“设计(论文)要求”一栏中加以体现;(2)“课题性质”一栏, A.工程设计,B.理论研究,C.实验研究,D.计算机软件,E.综合论文;(3)“课题来源”一栏:A.指导教师的科研课题,B.指导教师收集的科研和生产实际中的课题,C.学生在科学活动和工程实践中自立的课题,D.自拟课题;(4)“课题简介”一栏:主要指研究设计该课题的背景介绍及目的、意义。5. “设计(论文)要求(包括应具备的条件)”一栏:主要指本课题技术方面的要求,而“条件”指从事该课题必须应具备的基本条件(如仪器设备、场地、文献资料等)。 淮海工学院毕业设计(论文)任务书
题 目 Web搜索引擎的设计与实现 学 院 电子工程学院 专业班级 电子信息工程 xxxx 学生姓名 学 号 1.毕业设计(论文)应达到的目的
网络的迅猛发展,使得信息的搜索变得越来越重要,通用搜索引擎成为了人们上网寻找信息不可或缺的工具。本课题在研究搜索引擎基本原理、架构设计和核心技术的基础上,结合小型搜索引擎的需求,构建一个运行稳定,性能良好而且可扩充的小型搜索引擎系统,实现网络爬虫,信息处理,排序索引,搜索等基本功能。通过该系统的设计还可以提高学生的实践和动手能力使学生能将理论和实际相结合,拓展学生的知识面,使学生在数据库、算法及程序设计、网络通信、XML技术等方面的能力都有质的提高。对学生适应将来的工作岗位具有现实意义。
2.毕业设计(论文)的内容和要求〔包括原始数据、技术要求、工作要求等〕 本课题在研究搜索引擎基本原理、架构设计和核心技术的基础上,结合小型搜索引擎的需求,构建一个运行稳定,性能良好而且可扩充的小型搜索引擎系统,实现网络爬虫,信息处理,排序索引,搜索等基本功能。本系统的主要实现功能:
1.爬虫功能:利用Heritrix来实现网络爬虫,并采用数据库来存储url。
2.网页的内容解析:使用htmlparse进行网页的处理与分析。
3.中文分词处理:参照lucene的切词原理,对词库进行了一个细分,并且在
文档评论(0)