第4章计算机信息检索.pptVIP

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章计算机信息检索

计算机信息检索;第一节 计算机检索基础知识;一.脱机批处理检索阶段(1954~1964年)(off-line retrieval) 单机检索,以批处理进行的。 二.联机检索阶段(1965~1971)(on-line retrieval) 终端机从主机获取信息,人机对话,检索是以命令的形式进行的。 三.光盘检索阶段(1978-)在发达国家,光盘检索是联机检索的支持和补充,但在通信技术不太发达的国家,由于它自身的优点,却是用户获取信息的一个十分重要的手段 四.网络信息检索阶段(1990~) 又叫混合型检索,指Internet,具全球性的,知道网址就可以随时随地访问。 ; 1.光盘检索:以菜单形式检索. a.光盘单机检索----(CD-ROM)只读式光盘检索. b.光盘联机检索----局域网内的检索. 2.网络检索 a.局域网检索 b.互联网检索;计算机信息检索原理;计算机检索的实质:“匹配运算”。检索者以人机对话的形式把检索提问变成机器能识别的检索命令输入计算机中,由计算机自动对数据库中的记录进行匹配后输出检索结果。 逻辑提问式:用逻辑符号(与、或、非)将提问特征(主题词、分类号、自由词、作者等)连接起来的式子。;计算机检索的过程(基本步骤);计算机信息检索方法;1.布尔逻辑检索(复合检索);截词检索就是在检索词中保留相同的部分(即词干),用相反的截词符(常用的有?、$、*)等代替可变化部分并代表许多相同词干检索用词的一种检索方法。 截词方式:左截断、右截断、中截断、左右截断 右截词:前端一致. 如:chemi*表示查找结果含有chemical,chemist,等 左截词:后端一致。 如:*physics--- physics,biophysics, chemophysics等 中间截词:wom*n---woman,women. 左右截断:中间一致 * relation * 可以查找relation, relations,或者interrelation , interrelationship等。 ; nW关系:要求所连接的两个检索词在结果中相互距离不超过n个词或字,而且前后顺序不能颠倒。 nN关系:前后顺序可以颠倒。 例如:A(2W)B;A(2N)B ;4.限制检索 ;5.加权检索:很少用 ;第二节 Internet信息检索;网络信息检索工具的类型;1.www(环球信息网) 2.电子邮件(E-mail) 3.远程登录(Telnet):本地可登录外地计算机 4.文件传输协议(FTP):下载或者上传 5.电子公告版(BBS)发布公告或信息:远程登录的讨论;WWW方式下讨论。 6.其它:网络新闻组等 ;(1)概念 www是world wide web(环球信息网)的缩写。中文名称为万维网。它是在Internet环境下实现分布式超文本检索的体系。 作用:WWW采用的是客户/服务器结构,整理和储存各种WWW资源,并响应客户端软件的请求,把客户所需的资源传送到Windows UNIX或Linux等平台上。 网页、网站:网站(web服务器)是由网页集合而成的,而大家通过浏览器所看到的画面就是网页,网页说具体了是一个或多个html文件,浏览器是用来解读这份文件的。 ;(2)超链接与超文本 用户通过浏览器观看一个网页时,会发现一些带有下划线的文字或图形图片等,当鼠标指针指向这一部分时,鼠标指针变成手形,称之为超链接。当鼠标单击超链接时,浏览器就会显示出与该超链接相关的内容。 具有超链接的文本就称为超文本。 ;(3)统一资源定位符(URL): 在www中用URL(uniform resource locator)定义资源所在地,URL的地址格式为: 应用协议类型://信息资源所在主机名(域名或IP地址)/路径名/…/文件名 例:/(域名地址)表示用HTTP协议访问主机名为的web服务器的主页。 域名地址以层次化表示,最右边是国家,中国为cn,美国则省略;其次是机构,edu表示教育单位, gov政府机构,net网络服务机构,com商业机构;再次是子网名称,我们学校子网域名为spu;最左边是服务器类别,www表示这台计算机是一台Web服务器。 (4)HTTP协议: 在web服务器和用户计算机间使用的超文本传输协议。 ;二.Internet信息获取的常用辅助工具 ;1.概念: 搜索引擎(Search Engines)指对WWW站点

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档