- 1、本文档共71页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]7课件4网络资源检索
* 4 搜狐 搜狐 / 1988年创立,搜狐收录网站四十多万,已形成庞大的中文网站数据库。 搜狐的目录导航式搜索引擎完全由人工加工而成,相比机器人建工的搜索引擎具有很高的精确性、系统性和科学性。 * * 检索途径: 通过分类目录、关键词检索 检索技巧: 支持布尔逻辑检索。 “-” 、“”、 “/” 和 “( )” 。 检索结果: 根据关联程度排序 * 5 其它搜索引擎 AlAltaVista() AltaVista是DEC(Digital Equipment Corporation)公司1995年12月推出的万维网综合性搜索引擎。 至1998年底,AltaVista索引数据库标引的网页已达1.25亿。 AltaVista是网上内容最广泛、功能最强大、使用人数最多的搜索引擎之一。 * * * 天网搜索引擎 Maze在英汉词典中的解释 (来源:百度词典): n.1. 迷宫,迷津[C]; 2. 困惑,混乱[S] 天网Maze是一个PIC(Personal Information Center)文件系统。 * 资源方面: 1.学术论文可供查询和下载 2.娱乐 功能方面: 1.共享 2.查询 3.下载 * 1)基于超文本的信息查询 ?通过超文本链接逐步遍历庞大的Internet, 从一个www服务器到另一个www服务器, 从一个目录到另一个目录, 从一篇文章到另一篇文章, 浏览查找所需信息的方法称为浏览,也称基于超文本的信息查询方法。 * 随着www服务器的急剧增加,通过一步步浏览来查找所需信息已非常困难。 为帮助用户快速方便地搜寻所需信息,各种www信息查询工具便应运而生,其中最有代表性的是基于目录和基于搜索引擎的信息查询工具,而利用这些工具来查找信息的方法就被称为基于目录和基于搜索引擎的信息查询方法。 * (2)基于目录的信息查询 Internet上的目录一般以主题方式来组织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较具体的信息标题。 * 3)基于搜索引擎的信息查询 基于搜索工具的检索方法接近于我们通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获得检索结果(在Internet上是一系列节点地址)并输出给用户。 * 2 影响Internet信息检索的因素 影响Internet信息检索的因素很多,如信息资源质量、检索软件、用户水平等。 1)信息资源质量对信息检索的影响 2)检索软件对信息检索的影响 3)用户水平对信息检索的影响 * 三 搜索引擎的检索 搜索引擎的发展 搜索引擎的定义 搜索引擎的分类 常用搜索引擎的检索 * 1 搜索引擎的发展 搜索引擎(search engine),源于1990年由蒙特利尔大学学生Alan Emtage发明的Archie。 最早现代意义上的搜索引擎出现于1994年7月。Michael Mauldin创建了著名的Lycos。 94年4月,斯坦福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo。此后搜索引擎进入了高速发展时期。 * 2 搜索引擎的定义 搜索引擎是一类自动搜索、组织网络信息资源,并提供检索服务的信息服务系统,是为解决网上剧增的数字化信息检索问题应运而生的一类网络信息检索系统。比如:百度、Google * 3 搜索引擎的分类 1)按工作语种划分 (a)单语种搜索引擎。 指搜索时只能用一种语言查询。 (b)多语种搜索引擎。 指可以用多种语言查询。如“Altavista”,该网站可以用25种语言进行查询。 * 2)按搜索范围划分 (a)独立搜索引擎 检索时只在自己的数据库内进行,由其反馈出相应的查询信息,或者是相链接的站点指向。每个独立的搜索引擎都会有自己的查询特色。 * (b)多元搜索引擎 又称集成搜索引擎。它是将多个独立搜索引擎集合在一起,提供一个统一的检索界面,当用户提出检索提问后,它会将其发送给多个搜索引擎,同时检索多个数据库,并进行相关度排序后,将结果显示给用户。 * 3)按内容组织方式划分 (a)目录式搜索引擎(网站级) 提供一份按类别编排的Internet网站目录,各类下边排列着属于这一类别的网站的站名和网址链接,有些搜索引擎还提供了各网站的内容提要。 * (b)全文搜索引擎(网页级) 当该引擎搜索到一个网站时,会将该网站上所有的文章(网页)全部记录下来,并收入到引擎的数据库中。只要用户输入查询的关键词在引擎数据库中的某个主页中出现过,则这个主页就会
文档评论(0)