- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】
职业学院毕业论文(设计)
题 目 搜索引擎中搜索器的研究与实现
学 生
学 号
专业班级 计算机应用技术
系院名称 计算机信息工程系
指导教师
二○○七年六月十日
独 创 性 声 明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得xxx职业学院或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。
签 名: 年 月 日
关于论文使用授权的说明
本人完全了解xxx职业学院有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。
(保密论文在解密后应遵守此规定)
学生签名: 年 月 日
导师签名: 年 月 日搜索引擎中搜索器的研究与实现
摘 要
搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。首先介绍了搜索引擎的工作原理及其系统结构,然后分析了搜索引擎中搜索器的地位和重要性,最后提出了实现一个中小型网站智能搜索引擎的设计思路。
本文对于智能搜索器的设计与实现,主要是在现有网络蜘蛛的基础上,提出了以网页评价值或权威度为依据确定搜索策略的思路,并提出了更快捷、更全面的提取URL的策略。本文对如何提取文档摘要做了研究,提出以语句位置、关键词、与标题相关度、累计相似度四个参数为依据,按所得到的语句权值对文中所有语句进行排序,确定语句在整个文档中的重要性,由此按照一定的压缩率得到整个文档的摘要。
本文的研究既具有一定的理论意义和技术价值,又具有一定的市场价值,它将有助于搜索引擎智能化的提高,对生活信息、娱乐信息、科研信息、商业信息的检索和获取,扩大商业机会,具有较大的社会和经济效益。
关键词:搜索器,URL,智能,搜索策略,文档摘要目 录
搜索引擎中搜索器的研究与实现 i
目 录 ii
第1章 前言 1
1.1 课题的意义 1
1.2 国内外研究现状 1
1.3 课题的研究目标 1
第2章 搜索引擎的工作原理和系统结构 2
2.1 搜索引擎的工作原理 2
2.2 搜索引擎的系统结构 3
2.3 本章小结 3
第3章 搜索引擎中搜索器的设计思想 4
3.1搜索器基本概念的理解 4
3.2智能搜索器系统结构的设计 4
3.3 搜索策略的设计思想 4
3.4 文档摘要提取方法设计思想 4
3.5 本章小结 4
第4章 智能搜索器的设计实现 5
4.1 搜索器的搜索程序的设计 5
4.2 文档摘要提取的具体设计 5
4.3 本章小结 5
第5章 试验结果 6
5.1 搜索算法的试验结果与性能分析 6
5.3 本章小结 6
第6章 总结 7
6.1 主要工作和创新点 7
6.2 存在的问题及未来的方向 7
参考文献 8
致谢 9
个人简历 10
第1章 前言
1.1 课题的意义
因特网上的信息呈几何级数增长,面向因特网的信息获取与处理技术是当前计算机科学与技术领域急需研究的课题。
1.2 国内外研究现状
国内关于搜索引擎和搜索器的研究始于对国外相关成果的介绍,到现在渐渐成为热点,从论文数量的分支专题分布看,综合性研究论文的数量远远超过细分化专门领域的论文及成果数量。
国外未来搜索引擎的发展应朝着智能型综合化的方向发展[1] [2]。
1.3 课题研究目标搜索搜索能力。全、准、快省。
拟解决的关键问题:
(4-4)
于是累计相似度可以用下式计算:
(4-5)
4.3 本章小结
搜寻程序要对网站内部的URL进行系统而全面的遍历CHINA—VIVI的实现.吉林大学学报.2003(4)
注:参考文献要十篇以上。
致谢
本论文是在 副教授的悉心指导下完成的,在此向李教授表示我衷心的感谢!
感谢李教授两年多来在各个方面给予我无私的关怀和精心的教诲,正是李教授渊博的知识和严谨的教学态度,使我在学习等各个方面受益匪浅,能够在李教授的指导
文档评论(0)