文本信息检索中饰语作用的研究
摘 要
随着网络信息时代的到来,信息日新月异,并呈指数增长趋势,形成“信息
爆炸”。在进行信息检索时,与用户需求匹配的信息经常不在检索结果内,而大
量用户不需求的信息——“信息垃圾”,却占用检索结果的相当大的~部分。因
此,改进文本信息检索系统的检索性能,提高检索质量就成为亟待解决的问题。
该论文的主要研究目的是,针对可能影响检索效力的一个容易被忽略的因素
——修饰语,研究其在文本信息检索中的作用。针对这一目的,开发了改进的向
进而说明修饰语的作用。
本文通过对修饰语作用的研究,主要取得以下成果:
(1)传统模型(如布尔检索模型)的查询语句关键词以及文本关键词仅仅为
独立的实词(名词、动词、形容词、副词),将传统的向量空间模型(Vector
Model,VSM)进行改进,设计并实现了能够完成该研究目的的信
Space
息检索模型(MVSM)。该模型与传统向量空间模型主要区别以及优点
在于:它将传统的检索关键词(本文中主要指名词)与修饰它的修饰语
(本文中主要指形容词)作为一个整体关键词来看待,一定程度上确定
了歧义词的真正含义;同时,将检索关键词中的修饰语以及它所修饰的
中心词根据
原创力文档

文档评论(0)