一种基于加权网络和句子窗口方案的信息检索模型-武汉大学信息检索.pdf

一种基于加权网络和句子窗口方案的信息检索模型-武汉大学信息检索.pdf

一种基于加权网络和句子窗口方案的信息检索模型-武汉大学信息检索

情报学报 JOURNAL OF THE CHINA SOCIETY FOR SCIENTIFIC       ISSN 1000 -0135 AND TECHNICAL INFORMATION ISSN 1000-0135 第卷第期 , 年月 32 8 797 -804 2013 8 Vol.32  No.8,797 -804 August  2013  doi:10.3772/ j.issn.10000135.2013.08.002 1) 一种基于加权网络和句子窗口方案的信息检索模型 陆伟程齐凯     (武汉大学信息资源研究中心,信息检索与知识挖掘研究所,武汉  430072)     摘要 经典的信息检索模型在文档表示上多采用词袋模型,与此不同,本文提出了一种基于加权网络的信息检 索模型。在这一模型中,文档被表示为一个加权共词网络,词汇在文档中的重要性通过词项节点在网络中的重要 性加以衡量。基于固定窗口平移和句子窗口方案,本文提出了文本游走模型Textrank 的四个检索模型变种,分别 是 、 、 和 。在 Win_Weighted_Textrank Sent_Weighted_Textrank Win_Weighted_Posrank Sent_Weighted_Posrank Reuter RCV1 Textrank Posrank 上的实验证明,与无权网络模型 、 相比,本文提出的模型能显著地提升检索效果。     关键词 信息检索  信息检索模型  加权网络  共词网络 An Information Retrieval Model Based on Weighted Graph and Sentence Lu Wei and Cheng Qikai ( , , ) Centerfor Studies of Information Resources Wuhan University Wuhan 430072 Abstract    ( ) , A standard approach to Information Retrieval IR is to model text as a bag of words. Alternatively this paper proposes a weighted graph based information retrieval model which expresses document as a weighted cowords network. We measure the “eliteness”of a term by weighted textrank. With the setting listed above,this p

文档评论(0)

1亿VIP精品文档

相关文档