搜索引擎的个性化检索的研究(翁畅平).ppt

主要内容 研究背景 问题的提出 搜索引擎个性化检索 概念 特征 现状 搜索引擎个性化检索的关键技术 1.研究背景-1 Internet上的信息资源特点 内容广泛,类型多样,涉及到人类生活的各个领域。 更新速度快。 信息重复率高。 信息结构化程度低。 信息过载,资源迷向。 1.研究背景-2 搜索引擎的发展 第一代搜索引擎是以1995 年出现的yahoo,altavista 和infoseek为代表。它们根据相关程度对结果进行排序。这种相关程度主要是以匹配到的关键词的多少、 关键词在页面上出现的位置及关键词在页面上出现的频率来加权和计分,因此这种相关程度排序仅仅是系统对检索结果的一种判断,并不一定符合用户的客观需求。 第二代搜索引擎是以1998年出的google和directhit 为代表。它们是根据以往用户实际访问一个网站并在该网站上所花费的时间来确定一个网站的重要性,或者根据一个网站被其他网站链接的数量来确定网站的重要性。 第三代搜索引擎是正在研究和开发的智能搜索引擎,个性化要求是它的主要特色之一。 1.研究背景-3 用户个性化需求的凸显 信息用户由图书情报机构服务的专业研究人员扩大到普通百姓; 由于每个人的生长环境、受教育背景等个不相同,对搜索结果的期待有很大差异。 人的兴趣、研究具有阶段性。 3.搜索引擎个性化检索

文档评论(0)

1亿VIP精品文档

相关文档