- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五讲 计算机检索与光盘检索 本讲内容 计算机检索的相关知识 计算机检索的基本方法 计算机检索的策略与评价 CA on CD 一、 计算机检索相关知识 计算机检索的原理 计算机检索的基本过程 计算机检索的特点 计算机检索系统的构成 计算机检索的类型 1、计算机检索的原理 计算机检索,就是利用计算机对信息进行存贮和检索,包括信息的存贮过程和信息的检索过程。 存贮过程:把分散的信息进行搜集、整理、分析、标引,以描述信息内容及特征,输入到计算机中,建立相应的数据库。 检索过程:将用户的需求转化为检索系统可识别的提问标识,并与系统内信息进行比对,将满足用户需求的信息输出给用户。 2、计算机检索的基本过程 计算机检索的基本过程分为三个阶段 1、提出问题阶段 2、检索阶段 3、结果输出与反馈阶段 3、计算机检索的特点 检索速度快 信息量大、内容更新快 检索点多、检出率高 能充分达到资源共享的目的 能满足多元检索的需求 服务方式灵活 4、计算机检索系统的构成 逻辑组成:指计算机信息检索系统所包含的功能模块或子系统及其相互关系。包括:数据源选择与采集子系统、标引子系统、建库子系统、词表管理子系统、系统用户接口子系统、提问处理子系统 物理组成:主要包括硬件部分、软件部分、数据库。 数据库的概念与类型 概念:在计算机存贮设备上按一定方式存贮的相互关联的数据集合。 类型:按内容划分 5、计算机检索的类型 1、按检索设备及工作方式分类 脱机检索、联机检索、光盘检索、网络检索 2、按检索内容分类 文献检索系统、数值检索系统、事实检索系统、全文检索系统 3、按计算机检索提供的服务方式分类 定题检索、回溯检索、日常检索 二、计算机检索的基本方法 布尔逻辑检索 截词检索 位置运算符检索 限制检索 1、布尔逻辑检索 布尔逻辑检索: 是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。其常用运算符有逻辑与、逻辑或、逻辑非。 逻辑与:用“AND” 或者“*”来表示相交关系 如:A and B 表示检索结果要同时含有A和B所代表的检索词,用于缩检。 逻辑或:用“OR”或者“+”来表示并列关系 如A OR B 表示检索结果要含有检索词A或者检索词B或者同时含有检索词A和B,用于扩检。 逻辑非:用“NOT” 或者“-”来表示排斥关系 如:A NOT B 表示检索结果要含有检索词A而不能含有检索词B,用于缩检。 布尔逻辑运算的次序问题 (1)在计算机检索系统中,默认从左到右依次运算; (2)在不同的检索系统中,逻辑与、逻辑或、逻辑非的运算次序不相同; (3)为明确运算次序,可以用小括号()来限定,多层括号的时候,先算内层括号,再算外层。 2、截词检索 概念:截词检索就是在检索中保留相同的部分(即词干),用相应的截词符代替可变化部分,以检索出具有相同词干部分并满足相应截词规则的一种检索方法。 截词符:*为无限截词符,代表多个字符;?为有限截词符,代表一个字符。 截词检索的几种截断方式 (1)前截断(左截断、后方一致) 如:*学生,可检索出:中学生、大学生、三好学生 等 (2)后截断(右截断、前方一致) 如:人*,可检索出:人民、人民币、人文 等 (3)前后截断(左右截断、中间一致) 如:*om*,可检索出:come、home、domo等 (4)中间截断(前后一致,一般只允许有限截断) 如:m?n,可检索出:men,man 等 3、位置运算符检索 概念:位置运算是单词之间的位置比较运算,只有当记录中单词的位置关系符合检索式的指定时候,文献才会被命中输出。单词之间的位置关系包括词距和词序两个方面。词距指两个单词之间的间隔距离,词序指两个单词之间的先后顺序。 (1)(W) 与(nW)算符 (W),即With,表示算符两侧的检索词必须紧密相连(除了空格与标点符号外),且词序不可颠倒; (nW),W的含义为Word,n为数字,如A(5W)B,表示A和B之间最多允许有5个单词间隔,A和B之间的词序不可颠倒。 (2)、(N)与( nN)算符 (N),即Near,表示算符两侧的检索词必须紧密相连(除了空格与标点符号外),且词序可以颠倒; (nN),n为数字,如A(5N)B,表示A和B之间最多允许有5个单词间隔,A和B之间的词序可以颠倒。 (3)、(F)算符 (F)算符中的“F”的含义为“Field”,表示该算符两侧的检索词必须在同一字段(如:标题、著者等)中出现,且词序可以颠倒。 (4)、 (S)算符 (S)算符中的“S”的含义为“Sentence”,表示该算符两侧的检索词必须在同一句子中出现,且词序可以颠倒 比较上述的运算符,按照限制程度的大小排序
文档评论(0)