- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于ajax lucene构建搜索引擎的设计和实现.doc
基于Ajax+Lucene构建搜索引擎的设计和实现
摘nbsp;nbsp;要
通过搜索引擎从互联网上获取有用信息已经成为人们生活的重要组成部分,Lucene是构建搜索引擎的其中
一种方式。搜索引擎系统是在.Net平台上用C#开发的,数据库是MSSQLnbsp;Servernbsp;2000。主要完成的功能有
:用爬虫抓取网页;获取有效信息放入数据库;通过Lucene建立索引;对简单关键字进行搜索;使用Ajax
的局部刷新页面展示结果。
论文详细说明了系统开发的背景,开发环境,系统的需求分析,以及功能的设计与实现。同时讲述了搜索
引擎的原理,系统功能,并探讨使用Ajax与服务器进行数据异步交互,从而改善现有的Web应用模式。
关键词:Lucene.net;异步更新;Ajax;搜索引擎
nbsp;引言
1.1nbsp;课题背景
Lucene是一个基于Java的全文信息检索工具包,它为应用程序提供索引和搜索功能。Lucene目前是Apache
Jakarta家族中的一个开源项目。也是目前最为流行的基于Java开源全文检索工具包。Lucene是Java世界
中常用的索引API,使用它提供的方法可以为文本资料创建索引,并提供检索。Lucene.net它只在命名方
面采纳了.Net的建议,主要目标倾向于和Javanbsp;Lucene兼容:一个是索引格式兼容,达到可以共同工作的
目的;一个是命名接近(只相差很少,比如大小写等),目的是可以方便开发者使用Javanbsp;Lucene相关的
代码和资料。
1.2nbsp;国内外研究现状
国内外对搜索引擎研究比较著名的便是Google了。无论搜索技术本身还是搜索范围与深度,Google搜索总
是所有搜索引擎的目标。Google专业领域搜索方面做的成效是有目共睹的。Google在低层次的智能搜索方
面已经开始研究很多年了,实际的成果就是翻译方面。利用搜索技术,加上经验主义发展出来的Google翻
译机器人,在外语翻译方面已经比传统的翻译好很多了。但是翻译仅仅是学术方面的应用,更重要的是
Google建立起来的海量搜索历史记录。如果把这些海量搜索历史记录当作是词典的话,那么如果与搜索技
术的结合发展成为低层次的只能搜索,那么应用就将大大加强与广泛。
国内,对搜索引擎的专注和对中文的理解能力也是中国本土搜索引擎行业独特的竞争力。国内比较著名的
比如百度,更专注对中文的处理。中文的意思多种多样,是很难用程序处理的。目前国内外都在做中文引
擎,门户网站、非门户网站也都在进军搜索业,成立搜索门户。为了满足用户更深层次的需求,国内的搜
索引擎也在不断的完善自己。如何将人类的知识和智能加入到检索中,如何使搜索引擎的质量产生一个质
的飞跃,也是国内搜索引擎努力的方向。中国网民对智能化搜索需求也是显而易见的。这也意味着搜索不
再是简单的技术或者是网络导航而已,而是会成为普通人生活中必备的工具之一。
1.3nbsp;本课题研究的意义
随着计算机技术和互联网技术的飞速发展,网络上的信息量急剧增长,要在浩如烟海的网络世界中寻找需
要的信息,作为现代信息获取技术的主要应用,那么搜索引擎是必不可少的。通过Lucene.net,可以很方
便的构建起搜索引擎,本毕业设计除了考查使学生综合运用以前所学知识的能力,同时也使学生了解当今
搜索及编程的一些新技术,并模拟简单的搜索引擎开发。
1.4nbsp;本课题的研究方法
在本系统的开发过程中,首先分析了搜索引擎的相关功能,写出需求分析;其次,综合运用以前所学的相
关知识(数据库,C#等),选择所熟悉的开发工具进行开发(本系统选择了Microsoftnbsp;Visualnbsp;Studio
.NETnbsp;2003作为开发平台,开发语言选择了C#;数据库采用Microsoftnbsp;SQLnbsp;Servernbsp;2000)。由于Lucene不
是完整的搜索引擎程序,只为搜索引擎应用提供了工具包,在Asp.net平台中,可使用Lucene.net这个对
Lucene兼容的库。使用Lucene.net协助完成搜索引擎相关的网页爬虫与抓取,为文档建立索引,关键词搜
索的功能,通过Ajax优化系统,完成页面的局部刷新功能,给用户好的体验。
2nbsp;Lucene.net构建搜索引擎原理
2.1nbsp;全文搜索引擎
2.1.1nbsp;搜索引擎的分类
获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。真正意义上的搜nbsp;
索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引
,建立索引数据库的全文搜索引擎。当用
您可能关注的文档
- 实验诊断实习指导目录.doc
- 华为新员工转正笔试题全集.doc
- APPENDIX D - Stillwater County, Montana附录-静水县,蒙大纳.doc
- 产业转移视角下中小企业集群创新网络的动态演进——来自江苏共建产业园区的例证.doc
- VFP个人理财系统论文.doc
- CAM_Weapon_System_Sustai:cam_weapon_system_sustai.doc
- 基于VC++的弹力球游戏毕业设计论文.doc
- 批准课题立项的单位及时间.doc
- 作业1作业提交与批改系统HTML界面.doc
- 1一例有大量消化液丧失并伴有酸中毒的病人.doc
- How visible was the 2004 EP election in national news media 在国家新闻媒体2004的欧洲议会选举中是多么的可见.doc
- SEWERS AND SEWAGE DISPOSAL下水道和污水处理.doc
- 使用Microsoft Outlook 2007设置邮箱的方法.doc
- 教育部实施高校招生阳光工程.doc
- Northern California Convention - NA北加利福尼亚公约-钠.doc
- 初一数学导学案7-1有理数.doc
- VC毕业论文大随机数生成器算法的研究与实现.doc
- chapitre_marginaldoc:第_ marginaldoc.doc
- Atmospheric Emission License application form - West Rand District 大气排污许可证申请表-韦斯特兰德区.docx
- Costing Fees and Charges - Guidelines for Use by Agencies成本费用-使用机构的指导方针.doc
最近下载
- DMX512灯光调光控制程序.doc VIP
- 四种不同类型土壤保水剂保水性能的比较-生态学杂志.PDF VIP
- 2019年中央机关公开遴选和选调公务员笔试真题〔B卷完好版解析〕_党政公选考试公共科目题库_公共科目真题_模拟试题.docx VIP
- 北京市东城区汇文中学2023-2024学年七年级上学期月考数学试题(无答案).docx VIP
- 《有效复习》班队活动教案.doc VIP
- 四年级阅读理解专项训练可打印.docx VIP
- 法医考试题目及答案.doc VIP
- 《水泥胶砂保水率测定方法》GB_T 45002-2024.pdf
- USON介绍分析.ppt VIP
- 新学期小学英语开学第一课主题班会PPT课件.pptx VIP
文档评论(0)