信息检索模型.pptVIP

  • 33
  • 0
  • 约6.49千字
  • 约 48页
  • 2017-02-28 发布于湖北
  • 举报
信息检索模型 Wang Jimin Sept. 23, 2005 Outline ?信息检索 信息检索模型 IR模型的形式化表示 IR模型的分类 经典信息检索模型 布尔模型 向量空间模型 经典概率模型 信息检索 信息检索(information retrieval,IR),将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。 发展的几个阶段 手工检索(早期,情报检索) 穿孔卡片检索(1950s) 计算机检索(面向主题,1960s) 联机检索(1970s,1980s) Web检索(1990s) 实例:搜索引擎 搜索引擎(search engine,SE),Web上的一种应用软件系统,它以一定的策略在Web上搜集和发现信息,对信息进行处理和组织后,为用户提供Web信息查询服务 搜索引擎三段式工作流程 实例:搜索引擎 检索过程 现代信息检索的主要内容 建模 文献分类 系统构建 用户界面 数据可视化 信息过滤 查询语言 …. 相关概念 停用词(stop word),指文档中出现的连词,介词,冠词等并无太大意义的词。例如在英文中常用的停用词有the,a, it等;在中文中常见的有“是”,“的”,“地”等。 索引词(标引词,关键祠):可以用于指代文档内容的预选词语,一般为名词或名词词组. 词干提取(英文中) coun

文档评论(0)

1亿VIP精品文档

相关文档