- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模块一 因特网应用 第三节 因特网信息资源检索 一、信息资源检索工具 1.搜索引擎是自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。 2.主题目录是万维网上所使用的一种分层次排列的主题类索引,多数主题被划分为若干子类或子目录。 3.元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。 由于目录搜索引擎和全文搜索引擎各具特点,谁也无法完全取代,于是许多搜索网站都同时提供了这两种类型的服务,例如Google、Yahoo等。 二、信息检索工具的工作原理 1.全文搜索引擎的工作原理 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。 从因特网上抓取网页→建立索引数据库→在索引数据库中搜索排序→响应用户查询 从因特网上抓取网页:利用能够从因特网上自动收集网页的Spider系统程序,自动访问因特网,并沿着任何网页中的所有URL爬到其他网页,重复这过程,并把爬过的所有网页收集回来。 建立索引数据库:由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其他网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。 在索引数据库中搜索排序:当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 响应用户查询:最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。 2.目录索引类搜索引擎的工作原理 以人工或半自动方式收集信息,由编辑人员查看信息后,人工形成信息摘要,并将信息置于事先确定好的分类目录框架中。分类目录一般不对文档内容进行自动分析,也不建立文档内容的索引,而是由人工进行评价,分类后给出简要的描述。用户通过分类目录来查看自己所需的信息,再链接到信息资源所在的位置。分类目录通常是按网站资源的主题性质进行分类,再细分为各科专题目录,最后列出具体的相关网站,开成一个由信息链组成的树状结构,即总目录-专题目录-链接-网站。分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”。 3.元搜索引擎的工作原理 元搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。 用户提交搜索请求,由元搜索引擎转换处理后,交给选定好的多个搜索引擎,同时检索多个数据库,并根据多个搜索结果进行二次加工(去重、排序和标明检索结果来源等),输出给用户。元搜索引擎是利用了其他搜索引擎的搜索结果,是基于搜索引擎之上的一种搜索引擎。 三、搜索技巧 1.掌握主要的搜索引擎 ,熟练运用它们的检索功能。 (1)提炼搜索关键词 选择正确的关键词是找到所需信息的关键。如果你要查的关键词较为冗长,将它拆成几个关键词来搜索,词与词之间用空格隔开。缩小搜索范围的简单方法就是在关键词间用逻辑命令“+、-、AND、NOT”等,可以获得更精确更丰富的搜索结果。运用加英文双引号进行强制搜索,加引号表示精确搜索这个词,不加的话这个词可能会将词分解,这一方法在查找名言警句时显得格外有效。为了准确地搜索到电影、电视、书籍等信息,可以加上书名号后再搜索。 三、搜索技巧 (2)了解特殊搜索命令的使用方法 Intitle:搜索网页标题中含有的关键词的网页。如“Intitle:张曼玉”表示只搜索网页标题中有“张曼玉”一词的网页。如果不加这个指令直接输入关键词就是从网站里找,不管是标题、描述还是正文内容。 Site:把搜索范围限定在特定站点中。例如,天空网下载软件不错,就可以这样查询:nero site:。 Filetype:表示搜索指定文件类型的网页。如想搜索论文研究方向是“互联网对人类心理带来的变革”相关的论文范例,可用搜索关键词“互联网 心理 filetype:do
文档评论(0)