个性化搜索引擎中检索技术的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
要 随着Internet 技术的飞速发展,搜索引擎日渐成为人们必不可少的一种工具。 虽然通用搜索引擎在一定程度上满足了用户的搜索需求,但是它没有考虑用户的 个人兴趣,当不同的用户输入同一个检索词时,搜索引擎将不做区分地返回同 的检索结果。实践证明,用户的检索目的是多种多 的。即使是同 的检索词, 不同用户所期待的检索结果也是各不相同的,因此需要一些更加贴近用户的手段 来改变这种方式,使得用户能够得到自己真正关心的信息,这就是 “个性化搜索 引擎”所试图解决的问题。 个性化搜索引擎是指那些针对不同用户背景返回不同检索结果的信息检索系 统。在这些系统中,文档的相关性是基于不同用户的背景和兴趣而单独计算的。 而用户的兴趣和背景通常是通过显式或隐式的用户反馈来获得。 本文围绕个性化搜索引擎中的用户反馈技术,从基于用户查询内容和用户查 询日志两个方面对用户查询进行查询扩展。由于根据用户的行为进行查询扩展, 难以避 用户的兴趣漂移问题。为了避 用户的兴趣漂移问题,本文在查询扩展 的基础上,对用户和文本分别进行聚类。在用户聚类中,根据用户查询行为结合 用户对查询词进行聚类,避 了查询词的歧义性造成的检索模糊问题;在文本聚 类中,利用常用的k-means 算法对文本进行聚类,由于通用k-means 算法对初始聚 类中心的确定是随机的,导致聚类结果的随机性。对于初始聚类中心,除了希望 分布得尽量分散之外,还希望这些中心点具有一定的代表性,即具有较高的密度, 基于这点,本文提出新的计算聚类中心的算法。该算法使得初始聚类中心根据 k 值的不同而有不同程度的分散度,聚类结果比较稳定,具有一定的代表性。 关键词:个性化搜索引擎,用户兴趣模型,用户查询扩展,用户聚类,文本聚类 1 Abstract With the rapid development of Internet technology, Search Engine becomes an indispensable tool increasingly. While general search engine meets the needs of users to a certain extent, but it don t consider the users personal interests, when different users input the same search words, the search engine will return the same results by no distinction between users differences. But Practice shows, users search is varied. Even inputting the same retrieval word, users are not looking forward to the same search results. We need some more means closing to the users to change this way, making users to get the information they really care. Which problems is the Personalized Search Engine try to resolve. Personalized Search Engines are those information retrieval systems which return different search results with the same search words by different users. In these systems, the relevance of documents is calculated based on the backgrounds and interests of different users. And the use

文档评论(0)

文献大师 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档