Lec.05-检索模型与搜索排序.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TOC ❖ 什么是检索模型? ❖ 布尔模型 ❖ 向量空间模型 ❖ TF-IDF框架 信息检索与搜索引擎 陈若愚 ❖ 检索质量评价标准 计算机学院 检索模型与搜索排序 北京信息科技⼤学 1 2 概述 内容相似性计算框架 ❖ 搜索结果排序是搜索引擎最核⼼的构成部分,决定了搜 查询表⽰:“苹果” 索引擎的质量好坏及⽤户的满意程度 ❖ 搜索结果排序最重要的两个因素是:(⽤户查询和⽹页 信息需求 的)内容相关性和⽹页链接情况 相关度计算 ❖ 在给定⽤户搜索词的情况下,如何判断⽹页内容是否与 检索模型 ⽤户查询相关,这是由检索模型决定的 ❖ 最重要的检索模型包括:布尔模型、向量空间模型、概 率模型、语⾔模型... ⽂档表⽰ 3 4 ❖ ⽤户发出查询词Q后,可以把⽂档集根据“是否相关”及 “是否包含查询词”两个维度进⾏划分 检索模型的理想化假设 包含查询词 不包含查询词 相关⽂档 I II ❖ 假设⽤户需求已经通过查询⾮常清晰明确地表达出来 IV III ❖ 检索模型的研究不涉及⽤户需求建模 不相关⽂档 ❖ ⽤户需求建模是现阶段搜索引擎发展的重要⽅向 ❖ 好的检索模型,应该在排序结果中,提升第⼀、第⼆象 限⽂档的排名,抑制第三、第四象限⽂档的排名 5 6 布尔模型 布尔模型(续) ❖ 布尔模型是检索模型中最简单的⼀种,其基础是集合论 苹果 AND (乔布斯 OR iPad2) ❖ ⽂档与⽤户查询由其包含的单词集合表⽰,两者的相似 性由布尔代数运算来判定 ❖ ⽤户查询以逻辑表达式的形式出现,即使⽤“与/或/⾮” ❖ 含义:如果⼀篇⽂档包含单词“苹果” ,同时也包含单词 等逻辑连接词将⽤户查询词串联,表达⽤户信息需求 “乔布斯”或“iPad2”两者中的任何⼀个,那这篇⽂档就是 满⾜⽤户需求的。 ❖ 满⾜⽤户逻辑表达式的⽂档就是相关⽂档

文档评论(0)

别拿青春赌明天 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档