C Ajax站内搜索引擎系统的设计与实现 Lucene.docVIP

C Ajax站内搜索引擎系统的设计与实现 Lucene.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
C Ajax站内搜索引擎系统的设计与实现 Lucene.doc

C#+Ajax站内搜索引擎系统的设计与实现+Lucene 摘要: Lucene是构建搜索引擎的一种方式。搜索引擎系统是在.Net平台上用C#开发的,数据库是MSSQL Server 2000。使用Lucene.net协助完成搜索引擎相关的网页爬虫与抓取,为文档建立索引,关键词搜索的功能,通过Ajax优化系统,完成页面的局部刷新功能,给用户好的体验,从而改善现有的Web应用模式。4623 关键词:Lucene.net;搜索引擎;Ajax;局部刷新 The Design and Implementation for Constructing the Search Engine with Ajax and Lucene Abstract:Lucene is the way of constructing search engine. This system is based on the .Net platform using C#. The database is MSSQL Server 2000. Use Lucene.net to help complete the search engine related webpage reptile and capture, document indexing, search function, by using Ajax optimization system, complete the page local refresh function, to the user a good experience, so as to improve the existing Web application mode. Key words: Lucene.net; Search engine; Ajax; Asynchronous update 目录 摘要1 1引言1 1.1课题背景及意义1 2系统实现过程中采用的技术2 2.1 Ajax技术2 2.2 Lucene 技术2 3系统的设计与实现3 3.1需求分析3 3.2方案设计4 3.3系统主要功能实现4 4 测试7 4.1功能测试7 5结论8 参考文献10 致谢11 站内搜索引擎系统的设计与实现 1引言 随着计算机技术和互联网技术的飞速发展,网络上的信息量急剧增长,要 在浩如烟海的网络世界中寻找需要的信息,作为现代信息获取技术的主要应用,那么搜索引擎是必不可少的。 目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文本类型的数据建立索引,所以你只要能把你要索引的数据格式转化成文本,Lucene 就能对你的文档进行索引和搜索。比如你要对一些 HTML 文档,PDF 文档进行索引的话你就首先需要把 HTML 文档和 PDF 文档转化成文本格式的,然后将转化后的内容交给 Lucene 进行索引,然后把创建好的索引文件保存到磁盘或者内存中,最后根据用户输入的查询条件在索引文件上进行查询。不指定要索引的文档的格式也使 Lucene 能够几乎适用于所有的搜索应用程序。 3系统的设计与实现 3.1需求分析 1、功能需求 本设计要实现的功能: 能够对Internet上的网页内容、标题、链接等信息按链式收集。 能够实现一定链接深度的网页收集,也就是在Internet上实现一定的URL级的数据收录。 对收集到的数据存入MSSQL Server 2000等关系型数据库中、或者存入文本文件中。 网站信息库中的信息会不断的变动,对收集到的数据需要定期的自动维护,做到定期的删除、从新收集。 对收集到的数据进行关键词的检索。 对检索出的数据要可定位性,即可以显示对数据的出处的链接。 实现中英文分词功能,能够按中文或者英文单词检索数据。 实现无刷新的显示搜索结果,对搜索用时的计算、显示,关键字高亮显示等。 2、性能需求 (1)精度: 对收集到的信息需要一定的完整性,即对链接层次里的每个链接页面都能够收集得到,并写入收集的存储区里。 对搜索出的内容需要包含有关键字信息 (2)时间特性要求: 数据收集时,因为是对Internet网上Web信息的收集,并且采用URL级链式的网页收集。收集数据时不能够出现无响应的等待。 引用 检索 图3 代码结构 2、索引生成模块 这部分包含对文本的索引生成以及对数据库数据的索引生成,下面只对数据库索引生成的关键代码进行介绍: 下面这段代码实现对数据库里存储的记录创建索引。主要通过Lucene提供的方法来协助实现。 首先通过标准分词定义了一个索引写入器 IndexWriter writer = new IndexWriter(indexDir, ne

文档评论(0)

czy2014 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档