- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索和利用教程
信息检索与利用教程 沈艳红 江南大学图书馆 第四章 Web信息检索 4.1 Web信息搜索概述 4.2 网站目录及举要 4.3 搜索引擎及举要 4.4 Web学术信息搜索工具举要 4.1 Web信息搜索概述 4.1.1 Internet 与 Web 4.1.2 Web信息搜索工具的发展 4.1.3 Web信息搜索的基本方式 基于超文本/超媒体的信息浏览 基于目录的信息查询 基于搜索引擎的信息检索 4.1 Web信息搜索概述 4.1.4 Web信息搜索的技巧 选择合适的搜索工具, 使用多个搜索工具进行查询。 抽取适当的关键词。 正确使用布尔逻辑和其他操作符号。 尽量多地给出查询项。 使用限制“域”功能。 4.1 Web信息搜索概述 4.1.5 网络信息检索的发展趋势 智能化 可视化 多样化 个性化 4.2 网站目录及举要 4.2.1 网络目录组织的信息资源的特点 树型目录结构组织信息资源,具有严密的系统性和良好的可扩充性。 分类不够细。 维护工作量大,信息量相对较少,信息更新不及时。 4.2 网站目录及举要 4.2.2 网络目录举要 雅虎中国() 雅虎中国既支持目录检索,也支持词语检索。它对网站信息按主题建立分类索引,按字母顺序列出大类,大类下设二级类目,各子类下有大量相关网站信息。这些类目是人工建立的,标引比较准确,因此查准率较高。 4.2 网站目录及举要 4.2.2 网络目录举要 雅虎中国() 4.3 搜索引擎及举要 4.3.1 搜索引擎的工作原理 搜索引擎构成 搜索器 索引器 检索器 搜索引擎的不足 准确性差 各种搜索引擎使用的检索符号、格式等不统一 4.3 搜索引擎及举要 4.3.2 Google Google是从第一代搜索引擎中脱颖而出的第二代搜索引擎的代表。1998年,两位斯坦福大学的博士生Larry Page和Sergey Brin创立了Google,它的使命就是要为用户提供网上最好的查询服务,促进全球信息的交流。 Google开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对20多亿网页进行整理,可为世界各地的用户提供适合需要的搜索结果,而且搜索时间通常不到半秒。现在,Google每天提供1.5亿次查询服务。 4.3 搜索引擎及举要 4.3.2 Google Google并非只使用关键词或代理搜索技术,它将自身建立在高级的PageRank?(网页级别)技术基础之上,这项技术可确保始终将最重要的搜索结果首先呈现给用户。 网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个变量和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。实质上,当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。 Google复杂的自动搜索方法可以避免任何人为感情因素。与其他搜索引擎不同,Google的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。Google可以诚实、客观并且方便地帮助用户在网上找到有价值的信息。 4.3 搜索引擎及举要 4.3.2 Google 基本检索:(布尔检索功能) 逻辑“与”:检索框中的两个关键词之间用空格隔开则默认为是“AND”(“与”运算)连接。 逻辑“非”:用“—”(减号)表示,同时要求在减号前保留一个空格。 逻辑“或”:用“OR”表示。 双引号、连字号、斜线、问号、等号、省略号都可以作为短语的连接符号查找名言或专有名词。 指定网域:利用site:可以在某个特定的网站或域中进行搜索。 指定文件类型:filetype:文件类型,可以在一类文件中进行搜索,比如,filetype:pdf, filetype:ppt等。 4.3 搜索引擎及举要 4.3.2 Google 4.3 搜索引擎及举要 4.3.2 Google 4.3 搜索引擎及举要 4.3.2 Google 4.3 搜索引擎及举要 4.3.2 Google 4.3 搜索引擎及举要 4.3.2 Google 4.3 搜索引擎及举要 4.3.2 Google 4.3 搜索引擎及举要 4.3.2 Google 其它检索语法 搜索的关键词包含在URL链接中:inurl: 搜索的关键词包含在网页标题中:intitle: 搜索的关键词包含在网页的“锚”中:inanchor: 或allinanchor: 搜索所有链接到某个URL的网页:link: 4.3 搜索引擎及举要 4.3.2 Google 高级检索功能 可以排除某个特定站点的网页(限定网域) 可以对检索结果页面的语言类型进行限制(限定语种) 可以限定检索结果的时间范围(更新日期) 可以限定关键词出
您可能关注的文档
- 保险公司最新早会模板和素材-20130417.ppt
- 保险公司组织和管理.ppt
- 保险原理和保险学.ppt
- 保险公司最新早会模板和素材-20130424.ppt
- 保险公司最新早会模板和素材-20130426.ppt
- 保险公司最新早会模板和素材-精英部早会模板.ppt
- 保险市场结构和运作.ppt
- 保险经济学第二讲保险市场需求供给和价格.ppt
- 保险营销信息管理和营销调研.ppt
- 信号和系统ch2_1DFS.ppt
- 2024年05月黑龙江双鸭山饶河县事业单位面向社会公开引进高学历人才10人笔试上岸历年高频考点(难、易错点)附带答案详解.docx
- 2024年05月黑龙江鸡西市营商环境建设监督局招考聘用笔试上岸历年高频考点(难、易错点)附带答案详解.docx
- 2024年06月安徽马鞍山含山县选任人民陪审员120人笔试上岸历年高频考点(难、易错点)附带答案详解.docx
- 2024年2月上海交通大学医学院附属上海儿童医学中心招考聘用100人笔试上岸历年高频考点(难、易错点)附带答案详解.docx
- 2024年06月春季奥体中心公开招聘笔试上岸历年高频考点(难、易错点)附带答案详解.docx
- 2024年06月中国农业电影电视中心公开招聘应届毕业生拟录用人选笔试上岸历年高频考点(难、易错点)附带答案详解.docx
- 公路工程监理工程师经济系列(公路工程经济)模拟练习试卷16.pdf
- 公路工程监理工程师经济系列(公路工程经济)模拟练习试卷8.pdf
- 设备工程进度管理方法练习试卷1.pdf
- 环境影响评价师(环境影响评价技术方法)模拟试卷74.pdf
文档评论(0)