2+文本分析检索模型和基于内容的图像检索.pptVIP

  • 11
  • 0
  • 约1.14万字
  • 约 59页
  • 2016-12-25 发布于重庆
  • 举报

2+文本分析检索模型和基于内容的图像检索.ppt

NMF 低秩分解 * * plsa是一种topic model,它属于生成模型,给定文档d后,以一定的概率选择d对应的主题z,然后以一定概率选择z中的词语w. PLSA的通俗理解: 想象某个人要写N篇文档,他需要确定每篇文档里每个位置上的词。假定他一共有K个可选的主题,有V个可选的词项,所以,他制作了K个V面的 “主题-词项” 骰子,每个骰子对应一个主题,骰子每一面对应要选择的词项。然后,每写一篇文档会再制作一颗K面的 ”文档-主题“ 骰子;每写一个词,先扔该骰子选择主题;得到主题的结果后,使用和主题结果对应的那颗”主题-词项“骰子,扔该骰子选择要写的词。他不停的重复如上两个扔骰子步骤,最终完成了这篇文档。重复该方法N次,则写完所有的文档。在这个过程中,我们并未关注词和词之间的出现顺序,所以pLSA也是一种词袋方法;并且我们使用两层概率分布对整个样本空间建模,所以pLSA也是一种混合模型。 * 与pLSA的不同?? * * * 信息检索模型是指如何对查询和文档进行表示,然后对它们进行相似度计算的框架和方法 本质上是对相关度建模 * 三类 基于内容的信息检索模型 结构化模型 浏览型数学模型 基于内容的信息检索模型有 集合论模型 布尔模型、模糊集合模型、扩展布尔模型 代数模型 向量空间模型、广义向量空间模型、潜在语义标引模型、神经网络模型 概率模型 经典概率

文档评论(0)

1亿VIP精品文档

相关文档