网站大量收购闲置独家精品文档,联系QQ:2885784924

[理学]lecture11-probmodel.pdf

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]lecture11-probmodel

IntroductionIntroduction  toto  InformationInformation  RetrievalRetrieval 2011/11/07 中科院研究生院2011年秋季课程《现代信息检索》 更新时间: 现代信息检索 Modern Information Retrieval 第11讲 概率检索模型 Probabilistic Information Retrieval 授课人授课人::王斌王斌 httpp :///~wanggbin 1 *改编自”An introduction to  Information retrieval”网上公开的课件,地址/IR-book/ 提纲 ❶上一讲及向量空间模型回顾 ❷基本概率统计知识 ❸Logistic回归模型 ❹BIM模型 ❺BM25模型 2 提纲 ❶上一讲及向量空间模型回顾 ❷基本概率统计知识 ❸Logistic回归模型 ❹BIM模型 ❺BM25模型 3 现代信息检索现代信息检索 结构化检索(Structured retrieval)  基本配置基本配置:结构化或非结构化查询结构化或非结构化查询++结构化文档结构化文档 结构化检索的应用场景 数字图书馆、专利数据库、博客、包含已标注命名实体 (如人名、地名)的文本 例子 数字图书馆数字图书馆: give me a ff ullll‐llengthh articlle on ff ast ff ourier transforms 专利专利: giive me pattens whhose cllaiims mentition RSARSA publiblic kkey  encryption and that cite US patent 4,405,829 实体标记文本实体标记文本:: givegive meme articlesarticles aboutabout sightseeingsightseeing tourstours ofof  the Vatican and the Coliseum 44 现代信息检索现代信息检索 XML 文档文档 55 现代信息检索现代信息检索 挑战1: 返回文档的一部分 XMLXML检索中检索中,用户希望返回文档的一部分用户希望返回文档的一部分 ((即即XMLXML元素元素)), 而不像非结构化检索那样往往返回整个文档 例子 如果在《莎士比亚全集》中查找Macbeth’s castle,那么到底应 该返回场(scene )、幕(act )还是整个剧本呢? 上述情况下上述情况下,用户可能在查找用户可能在查找场场((scene)scene) 但是,另一个没有具体指定返回节点的查询Macbeth ,应该返 回剧本的名称而不是某个子单位 解决办法: 结构化文档检索原理((structured

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档