11研-12讲-网络信息检索工具.ppt

  1. 1、本文档共95页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
11研-12讲-网络信息检索工具

第十二讲 网络信息检索工具 广州医学院 医学文献检索教研室 课堂讲授、课件制作:邓小茹 本讲主要内容 一 网络信息检索概述 二 综合型搜索引擎实例 Google(重点掌握) Baidu、Yahoo!、Sohu(一般了解) 三 专业型搜索引擎实例(一般了解) 四 小结 一 网络信息检索概述 1 网络信息检索的对象及其特点 网络信息资源(Network Information Resource)是以数字化形式记录,以文字、图像、声音、动画等多媒体形式表达,存储在网络计算机磁介质、光介质以及各类通讯介质上,并通过计算机网络通讯方式进行传递的信息内容的集合。 网络信息资源的特点 数量巨大,增长迅速 内容丰富,形式多样 时效性强,变化迅速 共享性和交互性 结构复杂,分布广泛 动态性强,缺乏管理 良莠不齐 2 网络检索工具 网络检索工具泛指因特网上提供网页信息资源检索和网站导航服务的站点,实质是一种网页或网址检索系统。主要面向互联网信息检索,并通过Internet来提供服务,通常又称搜索引擎。当用户输入关键词查询时,该搜索引擎会告诉用户包含该关键词信息的所有网址,并提供通向该网址的链接。 2.1 网络检索工具的原理 主要有五个部分: 数据采集(robot/spider) 数据分析与标引(indexer) 数据组织 数据检索 信息挖掘 2.2 搜索引擎的分类 收录信息范围不同 检索原理不同 (1) 收录范围划分 综合型搜索引擎 又称通用搜索引擎,是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。 如:Google(谷歌)、Yahoo!(雅虎)、Baidu(百度) 专业型搜索引擎 是专业信息机构根据专业需求,将Internet上资源进行筛选整理、重新组织而形成专业信息检索系统,专业针对性较强。 如:医学引擎:Medical Matrix、HealthWeb;地图引擎;音乐引擎 综合型搜索引擎 收录的信息涉及多个主题及多种信息类型,因此,利用它可以查找到几乎任何方面的信息。它往往基于检索词去匹配相关的内容,所以信息量大,时常也会因检出内容太泛而无法一一过目,有时会影响查准率。 如:Google(谷歌)、Yahoo!(雅虎)、Baidu(百度) 专业型搜索引擎 专门收集某种类型或某一主题网络信息,因此它的针对性较强,查准率较高,在提供专业信息资源方面要远远优于综合型搜索引擎,可以满足用户个性化需求的需要。 医药卫生学专业方面如: Medical Matrix、HealthWeb、BIOME等 (2) 工作原理划分 独立检索工具 目录/主题指南(Directory/Subject Guides) 由人工采集网站并进行分类,由专业人员进行加工并建成树状等级目录。保证了查准率,但查全率降低。如:Yahoo!(雅虎) 搜索引擎/网页搜索 通过网络机器人软件(Robot/crawler/spider)自动跟踪标引软件搜寻网页,自动进行关键词标引,它不需要人工干涉,数据更新快,查全率较高。如:Google(谷歌)等 元搜索引擎(Meta Search Engine) 又称集成搜索引擎,自身不采集信息,没有信息库,同时检索多个独立搜索引擎,以统一格式输出结果。搜索面广,信息量大,用时较短。 例如:Vivisimo、Ixquick、MetaCrawler、搜星、万纬搜索等。 二 综合型搜索引擎实例 且慢,先让我 一下? 1 的起源与发展 1994年Google 创始人、在读研究生Larry Page 和 Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者 1998年Google公司宣告正式成立 2006年4月12日Google将原中文名“科高”改为“谷歌”,意为“丰收之歌” 2010年3月23日Google把服务器移至香港 2011年8月15日Google收购摩托罗拉移动 2 的特色 检索响应速度极快,0.5秒内应答 PageRank网页级别技术与超文本匹配分析,客观评价网页的重要性,以提供相关性较高的搜索结果 智能化的“手气不错”功能,直接连接到可能最符合要求的网页,节约时间 “网页快照”从服务器里直接取出缓存的网页。用不同颜色标记检索词,很醒目。最好用的图像搜索工具 Google Print计划和Google Scholar计划使互联网用户方便获取图书馆书目信息及学术机构的学术信息成为可能 提供中文繁简体转换、英文单词解释和网页翻译功能 查询过程简图 中文Go

文档评论(0)

qwd513620855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档