- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.1. 计算机信息检索基础 3.2. 网上的信息检索及搜索引擎 3.1. 计算机信息检索基础 3.1.1 计算机信息检索—— 是指人们在计算机或计算机检索的终端机上,使用特定的检索指令,检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,即而在检索终端设备显示或打印的过程。 计算机信息检索发展过程 脱机检索阶段(50年代中期到60年代中期) 联机检索阶段(60年代中期到70年代中期) 光盘数据库检索阶段(70年代中期到80年代末) 网络化检索阶段(90初年代至今) 3.1.2 文献信息数据库 数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合 。 当数据库记录的对象为文献信息时,就称为文献信息数据库 。 文献信息数据库的结构 一个数据库通常由一个主文档(Master File)和若干个索引文档或称倒排文档(Inverted File)组成。 文档——是具有某种特征的全部记录的集合。 记录——是构成文档的基本单元,由各种反映文献特征的字段组成。如一篇论文、一件专利、一本图书、一个标准的相关信息都能够成为文挡中的一条记录。 字段——是记录的基本组成元素。一条记录的常见字段通常包含题名字段、著者字段、主题词字段、文献出处字段(如刊名等)多种字段。 顺排文档 倒排文档(主题) 文献信息数据库的类型 1.参考数据库(Reference database)指包含各种数据、信息或知识的原始来源和属性的数据库 主要包括书目数据库、文摘数据库、索引数据库。 2.全文数据库(Full text database)收录有原始文献全文的数据库 以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息为主 3.事实数据库(Factual database)指包含大量数据、事实,直接提供原始资料的数据库 又分为数值数据库(Numeric database)、指南数据库(directory database)、术语数据库(terminological database)等 3.1.3 计算机检索基本技术 布尔逻辑检索技术 布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。常用算符及含义: AND (*)——表示由该符号连接的检索式的运算结果为逻辑与。 OR (+)——表示由该符号连接的检索式的运算结果为逻辑或。 NOT (-)——表示由该符号连接的检索式的运算结果为逻辑非。 截词检索技术—— 截词检索就是在检索词中保留相同的部分(词干),用相应的截词符替代可变化部分,代表众多同词干检索用词的一种检索方法。一般来说,截词检索可提高信息检索的查全率。 截词的主要形式: 有限截段、无限截断 右截断:是前方一致检索,又称后截断,截词符放在被截词的右边,是最常用的检索技术,例如:librar* 中间截断:截词符在词的中间,例如:organi?ation, 可以检索organisation organization 左截断:又称前截断,截词符在词的左边,例如:*magnetic 位置检索技术—— 位置检索可要求检索词以用户所规定的相对位置出现。常用的位置算符及含义: ① (W)算符(WITH) 表示两个检索词紧挨着,词序不能颠倒, 中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。 ② (n W)算符(n WORD) 表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。 *位置检索技术—— ③(N)算符(NEAR) 表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。 ④(n N)算符(n NEAR) 表示两个检索词中间可以插入n个词,且词序可以颠倒。 *位置检索技术—— ⑤(F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。 ⑥(S)算符(SUBFIELD) 表示两个检索词必须出现在同一个子字段中,但两词的词序和插入的词数不限。 *位置检索技术—— ⑦(C)算符(CITATION)表示两个检索词必须出现在同一记录中,但两词的词序和所在的字段不限。
您可能关注的文档
最近下载
- 日语入门第一课(课件).ppt VIP
- 心内科进修汇报ppt.pptx
- 2014年10月自考《英语一》讲义-Unit-11-(含课文、生词表、课后练习及答案).doc VIP
- 7.2各民族谁也离不开谁教学设计.docx VIP
- 七年级生物上册 第二单元 第二章 第四节 单细胞生物教案课件 .ppt VIP
- 《条形统计图》教学设计.docx VIP
- 2014年10月自考《英语一》讲义-Unit-09-(含课文、生词表、课后练习及答案).doc VIP
- 部编版语文六年级上册夏天里的成长 第2课时-优课件.ppt VIP
- 浙江省台州市玉环市2023-2024学年六年级上学期期末科学试卷.docx VIP
- Python金融数据分析与应用课件 第5章 数据建模:有监督学习.pptx VIP
文档评论(0)