因特网信息资源检索.ppt.ppt

  1. 1、本文档共86页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
因特网信息资源检索.ppt

2004-10-28 第七章 因特网信息资源检索 第一节 Internet概述 计算机网络是一个数据通信系统,是将物理位置相对分散的计算机及其外部设备通过通信媒介互相连接起来,在网络软件的支持下,构成资源共享和数据交换的一个系统。 因特网(Internet)又称国际互联网,是全球计算机和计算机网络通过统一的TCP/IP协议(传输控制协议/互联协议)连接在一起的集合,这些网上计算机用户能够共享信息资源,交换各种信息。 因特网依靠TCP/IP协议,在全球范围内实现不同硬件结构、不同操作系统、不同网络系统的互联,进行数据通讯。 Internet上每部主机被赋予一个世界唯一的IP地址,用于与该主机有关的全部通信。 如:重庆文理学院 因为IP地址不易记忆,就引入了方便记忆的域名,通过域名管理系统(Domain Name System,DNS),可以把我们输入的具有助记性的主机域名转换为要访问的服务器的IP地址。 如:重庆文理学院 常用域名与机构性质对照表 常用域名与地理位置对照表 Internet网络信息资源 网络信息资源(Network Information Resource)是指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷型的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源。 网络信息资源特点 1)数量巨大,增长迅速。 2)内容丰富,形式多样。 3)信息发布自由,信息资源良莠不齐。 4)传播范围广泛。 5)网络信息具有一定的交互性。 网络信息资源检索途径 1、漫游法:在网上通过网络浏览器,从某一个网页上通过感兴趣的条目链接到另一网页上,在整个Internet上无固定目的进行浏览。 2、网络地址法:用户已知要查信息可能存在的地址信息,利用网络浏览器直接连到该网址的主页上进行浏览查找。 3、搜索引擎法:Internet网络上的信息检索系统。搜索引擎一般都提供有分类途径和关键词途径检索。 4、其它方法:如FTP文件传输、Telnet远程登陆、E—Mail电子邮件、Internet Meeting网络会议等。 第二节 搜索引擎 1. 搜索引擎的定义 搜索引擎(Search Engine)是指一种利用网络自动搜索技术,对因特网各种信息资源进行标引,并为检索者提供检索的工具。 搜索引擎其实也是一个网站,只不过该网站专门为你提供信息“检索”服务,它使用特有的程序把因特网上的所有信息归类以帮助人们在浩如烟海的信息海洋中搜寻到自己所需要的信息。 搜索引擎是一种工具,通过它你可以从茫茫网海中找到自己想要的信息。 常见搜索引擎: 2. 搜索引擎工作原理 检索结果排序 概率法是根据关键词在文中出现的频率来判定的,出现的次数越多,认定其与查询的相关程度越高; 位置法是根据关键词在文中出现的位置来判定,位置越靠前,文件的相关程度越高; 分类或聚类方法是指搜索引擎采用分类或聚类技术,自动把查询结果归入到不同的类别中。 3. 搜索引擎的类型 搜索引擎按其工作方式主要可分为三种,分别是: 全文搜索引擎(Full Text Search Engine) 分类目录型搜索引擎(Search Index/Directory) 元搜索引擎(Meta Search Engine) 全文搜索引擎(又称为关键词搜索引擎) 它提供对关键词、主题词、或自然语言的查询。用户在搜索框中输入检索词或检索表达式,搜索引擎会自动排查相关词,并按相关词的相关程度的高低排序加以链接。用户查到的是与你输入的关键词相关的一个个网页的地址和一小段文字。 如GOOGLE、百度就是这类搜索引擎 适用于查找目的明确,并具备一定检索知识的用户。 分类目录型搜索引擎 它是基于人工建立的搜索索引,提供一种可供检索和查询的等级式主题目录。信息收集时,利用大量人力浏览INTERNET页面,以超文本链接方式将不同学科、专业、行业和区域的信息按照分类或主题的方式组织起来,形成分类目录式的树状结构。这类引擎提供了一份由人工按类别编排的网站目录,下面排列着属于这一类别的网站的站名和网址链接,再记录一些摘要信息。 目前国外的YAHOO,国内搜狐、新浪、常青藤等都用这种搜索方式。 用户必须清楚信息所属的类别,查准率高,但查全率低。 目前,全文搜索引擎与分类目录搜索引擎有相互融合渗透的趋势。 原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。 而一些目录索引则通过与Google、百度等搜索引擎合作扩大搜索范围,向综合搜索发展,如Yahoo! 国内的国内搜狐、新浪、网易等 。

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档