chap计算机信息检索two重点.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chap计算机信息检索two重点

Internet 信息检索与利用 Internet 的基本知识 Internet三大基本应用 Internet需要具备的条件 Internet中的基本概念和术语 Internet三大基本应用 1.远程登陆(TELNET) 2.电子邮件发送或接收信息(E-MAIL) 3.文件传输通过文件传输协议(FTP), 实现推拉式服务. Internet需要具备三方面的条件 Internet中的几个基本概念和术语 搜索引擎(Search Engines) 是一种利用网络自动搜索技术,对因特网各种资源进行标引,并为检索者提供检索的工具。人们常把搜索引擎称之为网络之门,它包括万维网搜索引擎、新闻论坛搜索引擎、黄页搜索引擎、元搜索引擎等多种类型的搜索引擎,数量已达数百种。 搜索引擎的工作原理 搜索引擎的检索特性 搜索引擎的类型 英文YAHOO!主页 “Science”的详细类目 ”Biology”的下位类目 “Biotechnology”下位类目 “Biotechnology”中”Genetic Engineering”的下位类目及相关网络信息 最大的中文搜索引擎百度 Google主页 Google及其使用 Google 是由英文单词“googol”变化而来,表示 1 后边带有 100 个零的数字,代表Google想征服网上无穷无尽资料的雄心 世界上最大的搜索引擎。通过对 30 多亿网页进行整理,提供搜索结果,而且搜索时间通常不到半秒 有基本搜索和高级搜索两种方式。 Google及其使用 检索特性 两词之间用空格表示“AND” 支持短语搜索 ,用“” 对拼音关键词能进行自动中文转换 不支持“词干法” 可以查找 某种格式的 文件,如关键词后加上filetype:pdf,便可检索到PDF格式的文件 中英文单词互译:只需输入一个关键词(“翻译”,“fy” 和“FY” 任选其一)和要查的中 (英) 文单词,Google返回的网上字典链接即刻便可知道检索词词的英文(或中文)翻译。 也可利用 Google 目录根据主题来缩小搜索范围 高级搜索界面 D. 元搜索引擎(Meta-search Engine) 是在搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。 ProFusion主页 检索结果界面 著名元搜索引擎 Mamma ( ) 1996年面世,自称为“搜索引擎之母”的并行元搜索引擎,可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。其特点是检索界面友好,检索选项丰富,主要包括:可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。另外,Mamma支持常用检索语法在不同搜索引擎中的转换,还提供了专门检索页面文件标题的特殊检索服务,以及通过E-mail传输检索结果的特色功能。检索结果以相关性排序,内容包括网页名称、URL、文摘、源搜索引擎 Mamma主页 Mamma 强力搜索(Power Search)界面 著名元搜索引擎 MetaCrawler ( ) 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。其检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。其中,高级检索模式可实现:搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)等。以上内容均可作为定制检索的个性化选项并予以保存。另外,检索结果中包括一个以1000为最大值的相关度指标。 MetaCrawler主页 其他著名元搜索引擎 Ithaki ( /dir.html) 支持包括中文在内的14种语言检索 Ixquick ( /) 可搜索网站、MP3、新闻、图象等多种网络资源 InfoGrid ( /) 提供与主要搜索网站的直接连结和目录检索,具有强大的元搜索和新闻搜索功能 SavvySearch ( :2000/) 支持二十种语言(不包括中文),可调用全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目,可进行目录检索 C.综合式搜索引擎 此类搜索引擎既可以搜索网站也可搜索全文,用户输入关键词后,可以选择是搜索网站还是网页,不同的选择返回不同的结果。国内著名的

文档评论(0)

麻将 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档