- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
上一讲内容回顾 1 信息检索的概念和流程 2 信息检索的起源与发展 3 信息检索分类 4 信息检索工具及选择 5 信息检索策略及检索途径 6 信息检索步骤及检索技巧 7 图书馆与图书资源检索 8 文献保障与文献提供体系 第二讲 搜索引擎与网络资源 必须找? 哪里找? 如何找? 本讲主要内容 1 搜索引擎概述 2 Google及其使用技巧 3 百度及其使用技巧 4 常用的学术搜索引擎 5 关于搜索引擎的网站 搜索引擎已经成为人们最常用的互联网工具之一。目前互联网上的搜索引擎有上千种,每一种搜索引擎的覆盖率份额不等,每一种搜索引擎都有各自的优缺点,有不同的查询语言。 1 搜索引擎概述 1.1 搜索引擎的定义 搜索引擎,即Search engine,是一种能够通过Internet 接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。 网站提供的专门帮助人们在Internet网上查找信息的工具或系统。 搜索引擎常常是用户利用网上资源的第一途径。 1.2 搜索引擎原理 组成:WWW服务器,搜索程序(如spider、crawler、robot),索引数据库(包括成千上万甚至上亿个网页),检索程序(用来处理用户的检索请求)。 工作原理:从互联网上抓取网页→建立索引数据库→用户检索式的处理→在索引数据库中搜索排序→检索结果输出。 大多数搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。 面对Internet,各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。 大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,但也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。 我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。 你心里应该有这个概念:搜索引擎只能搜到它网页索引数据库里储存的内容。 通用型搜索引擎 通用型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,又称为综合型检索工具。如:Google、百度、AltaVista、Excite、Yahoo等。 专题型检索工具 专题型检索工具指专门用来检索某一类型信息和数据的检索工具,如查询地图的检索工具“MapBlast”、查询图像的检索工具“WebSEEK”等。 全文搜索引擎 全文搜索引擎是名副其实的搜索引擎。是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。 国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。 从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序,俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。 优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等高级功能。 缺点:繁多而杂乱的感觉。 目录式搜索引擎 目录式搜索引擎,又称目录索引。 虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。 目录一般按主题分类,并辅之以年代、地区等分类。网站多以此方式组织。例如:新浪分类目录计算机与互联网 硬件行情报价。 目录索引中最具代表性的莫过于大名鼎鼎的Yahoo。其他著名的还有Open Directory Pro-jec,简称ODP(/)、LookSmart等。国内的搜狐、新浪、网易搜索也都属于这一类。 优点:使用户清晰方便地查找到某一大类信息,尤其适合那些希望了解某一范围内信息,并不严格限于查询关键字的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,可能遗漏某些重要的信息源。 注意! 目前,全文搜索引擎与目录索引有相互融合渗透的趋势。 原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。 而一些目录索引则通过与Go
您可能关注的文档
最近下载
- 想象与真实:网络玄幻小说《诡秘之主》的空间叙事研究.pdf VIP
- GB 1499.2-2024 钢筋混凝土用钢 第2部分:热轧带肋钢筋.pdf VIP
- 2024~2025学年10月山东青岛城阳区青岛实验高中高一上学期月考数学试卷(详解版).pdf VIP
- 《中国重症肌无力诊断和治疗指南(2025版)》解读PPT课件.pptx VIP
- 国庆双节小区物业安全温馨提示.doc VIP
- 《强制性条文实施计划》.docx VIP
- 长春易加科技-数字化互联化智能工厂解决方案.pdf VIP
- 23CJ87-1 采光、通风、消防排烟天窗(一)参考图集.docx VIP
- 车辆GPS动态监控管理制度完整.doc VIP
- 2-2《TIPS操作手册(公共代码管理子系统)》.pdf
文档评论(0)