结合邻近度的语义位置语言检索模型.pdf

摘要 在过去的几十年间,许多经典的模型在信息检索领域诞生,诸如布尔模型、 用于信息检索,并且提出了查询似然语言模型,近十年来该模型得到了快速的发 展。随之国内外许多学者都加入了这个领域的研究,在大量的研究实验基础上, 研究者们又陆续的提出了隐马尔科夫模型,统计翻译模型,风险最小化模型等。 但研究者所提出的大多数检索模型都仅使用了词在文档中的频率这一特征, 而未考虑文档中词与词之间的位置关系。基于这点,Lv和Zhai提出了一种位置 语言模型,该模型细微到对每个词项位置建立一个语言模型。随后在位置语言模 型的基础上,余伟和王明文对其做出了改进,提出了一种结合语义的位置语言模 型(SPLM),并成功应用于信息检索。该模型的检索模型部分直接应用了插值 有缺陷。因此本文在他们的工作基础上进行了改进。近年来的研究表明应用查询 词项匹配在文档中的位置信息可以提高查询结果的准确性。如何更好地刻画查询 词在文档中的位置信息并建模,是研究提高检索效果的问题之一。本文在结合语 义的位置语言模型(SPLM)的基础上进一步考虑了词的邻近信息,并给出了用狄利 克雷先验分布来计算邻近度的平

文档评论(0)

1亿VIP精品文档

相关文档