基于lucene的个性化搜索引擎分析与实现-analysis and implementation of personalized search engine based on lucene.docxVIP

基于lucene的个性化搜索引擎分析与实现-analysis and implementation of personalized search engine based on lucene.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于lucene的个性化搜索引擎分析与实现-analysis and implementation of personalized search engine based on lucene

摘要伴随着 WWW 的发展,基于 WWW 的信息获取技术——搜索引擎技术出现并得到 迅速发展。由于互联网的开放性,使搜索引擎可以面向普通用户,用户需求进一步推动 其发展。个性化搜索引擎正是在考虑用户兴趣差异的基础上,借助数据挖掘技术对用户 搜索的信息进行再处理,从而使返回给用户的搜索结果更加贴近用户真实需求。随着信 息爆炸性增长及信息多元化发展,个性化搜索引擎逐渐成为研究热点和发展趋势。本文 对它的主要技术进行研究并实现了一个基于 Lucene 的个性化搜索引擎原型系统。本文针对个性化搜索引擎所做的主要工作体现在以下几个方面:1. 分析个性化搜索引擎的体系结构。个性化搜索引擎在体系结构上不同与传统搜索 引擎的部分在于其个性化模块部分,该模块负责用户兴趣模型的建立和更新、网页的个 性化排序。2. 用户兴趣模型的建立。个性化搜索引擎的关键就在于用户兴趣信息的获取,本文 通过分析用户历史搜索记录,采用 TF-IDF 算法得出用户特征词的权重值,若该特征词 的权重值大于某个阈值时,将该特征词设定为用户兴趣词,将其保存到用户兴趣库。3. 提出 SLR 排序算法。该算法包括两个主要计算过程,一是计算用户兴趣词和页 面内容的相似度,二是通过分析页面的入链和出链数量计算页面的链接得分,这两个计 算步骤分别从页面内容和页面结构上分析了该页面对于用户的重要程度,从而使返回的 页面排序更加符合用户的需求。4.实现了一个基于 Lucene 的个性化搜索引擎原型系统。该系统选择扩展性好的 Hertitrix 抓取网页信息;使用 Lucene 对网页信息建立索引及对网页信息进行检索。通过 对该系统的性能检测,有较好的准确率,基本达到本课题的预期目标。关键词:Lucene;个性化搜索引擎;排序算法;兴趣模型;检索AbstractAfter the WWW appear, the technology of information acquisition based on WWW—— search engine technology appear and development rapidly. With the openness of the Internet, the search engine can be for the general user, meanwhile, the needs of users further promote its development. In consideration of user’s different interest, personalized search engine can process the information of users search for, through data mining technology. So that the search results return to the users are more close to the real user needs. With the information explosion and information diversification, personalized search engine has become the research hotspot and development trend. This article analyzes its main technology and a personalized search engine based on Lucene was designed.The major works of this article can be generalized with the following aspects:Analyse the system structure of personalized search engine. In archtitecture, personalized search engine different from the traditional search engine only because which has personalization module. The module is responsible for the establishment and update of user interest model, personalized sorting of the pages.The establishment of user interest model. The key of personalized search e

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档