第6章 搜索引擎与开放获取.ppt

北京交通大学出版社《信息检索教程》(Information Retrieval Textbook)系列课件 1 互联网搜索引擎 搜索引擎的类型(1) 搜索引擎的类型(2) 搜索引擎的工作原理 搜索器也称为蜘蛛系统(Spider)或爬虫系统(Crawler),其功能是遵循一定的协议,在互联网中及时搜索和发现新的网页信息,并更新索引数据库,避免死链接。 分析器借助词频统计、词语位置认定和一些特殊算法,对搜索器抓回的网页进行标引,并对其中的网页超链接进行关联。 索引器根据分析器生成的关键词,建立从关键词到网页URL的关系索引倒排文档,即建立索引数据库。 检索器根据用户输入的提问词,在索引数据库中进行匹配运算,然后将查询结果按相关程度排序。 用户接口接收并解释用户输入的检索提问,最后将检索器查询的结果输出。 搜索引擎的检索功能 常用搜索引擎 —— 百度 基本检索 高级搜索语法 调整搜索结果 百度快照 常用搜索引擎 —— Google 检索界面 高级搜索语法 “手气不错” 调整搜索结果 网页快照 Google学术搜索 提供众多学科和资料来源,包括: 学术著作出版商(如“万方”、CNKI、维普中的部分内容) 大学等学术团体的作品 公开的学术刊物 专业类报纸的电子版 其他网络上可以搜索到的学术文章 学术搜索结果 结果排序综合考虑每篇文章的内容、作者、发表的刊物以及被其他学术文

文档评论(0)

1亿VIP精品文档

相关文档