- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 机检
3.1. 计算机信息检索基础 3.2. 网上的信息检索及搜索引擎 3.1. 计算机信息检索基础 3.1.1 计算机信息检索—— 是指人们在计算机或计算机检索的终端机上,使用特定的检索指令,检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,即而在检索终端设备显示或打印的过程。 计算机信息检索发展过程 脱机检索阶段(50年代中期到60年代中期) 联机检索阶段(60年代中期到70年代中期) 光盘数据库检索阶段(70年代中期到80年代末) 网络化检索阶段(90初年代至今) 3.1.2 文献信息数据库 数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合 。 当数据库记录的对象为文献信息时,就称为文献信息数据库 。 文献信息数据库的结构 一个数据库通常由一个主文档(Master File)和若干个索引文档或称倒排文档(Inverted File)组成。 文档——是具有某种特征的全部记录的集合。 记录——是构成文档的基本单元,由各种反映文献特征的字段组成。如一篇论文、一件专利、一本图书、一个标准的相关信息都能够成为文挡中的一条记录。 字段——是记录的基本组成元素。一条记录的常见字段通常包含题名字段、著者字段、主题词字段、文献出处字段(如刊名等)多种字段。 顺排文档 倒排文档(主题) 文献信息数据库的类型 (1) 参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。 参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。 (2) 源数据库 源数据库指能直接提供原始资料或具体数据的数据库。 它包括数值数据库、文本-数值数据库、全文数据库、术语数据库、图像数据库和多媒体数据库等。 (3) 混合据库 指数据中的数据,一部分只是提供参考数据库中的信息(文献的基本情况及线索);另一部分则可以提供全文数据库中的信息(原始文献本身)。 3.1.3 计算机检索基本技术 布尔逻辑检索技术 布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。常用算符及含义: AND (*)——表示由该符号连接的检索式的运算结果为逻辑与。 OR (+)——表示由该符号连接的检索式的运算结果为逻辑或。 NOT (-)——表示由该符号连接的检索式的运算结果为逻辑非。 截词检索技术—— 截词检索就是在检索词中保留相同的部分(词干),用相应的截词符替代可变化部分,代表众多同词干检索用词的一种检索方法。一般来说,截词检索可提高信息检索的查全率。 截词的主要形式: 有限截段 右截断 中间截断 左截断 位置检索技术—— 位置检索可要求检索词以用户所规定的相对位置出现。常用的位置算符及含义: ① (W)算符(WITH) 表示两个检索词紧挨着,词序不能颠倒, 中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。 ② (n W)算符(n WORD) 表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。 *位置检索技术—— ③(N)算符(NEAR) 表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。 ④(n N)算符(n NEAR) 表示两个检索词中间可以插入n个词,且词序可以颠倒。 *位置检索技术—— ⑤(F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。 ⑥(S)算符(SUBFIELD) 表示两个检索词必须出现在同一个子字段中,但两词的词序和插入的词数不限。 *位置检索技术—— ⑦(C)算符(CITATION)表示两个检索词必须出现在同一记录中,但两词的词序和所在的字段不限。 ⑧(L)算符(LINK)表示两个检索词之间存在从属关系或限制关系,如果其中一个为一级主题词,另一个就为二级主题词。 加权检索技术—— 加权检索是在检索提问式中,根据每个提问词在检索要求中的重要程度,分别给予一定的加权数值加以区别,我们称这个数值为权数。
您可能关注的文档
- 第15单元知识点测试.ppt
- 第13章 传感器信息融合.ppt
- 第12课时磁现象 电生磁.ppt
- 第18课 网络文明小公民2.doc
- 第18届“五羊杯”初三数学竞赛(含详解).doc
- 第19课时:作(画)图.doc
- 第14章 光学.ppt
- 第1章 作业-答案.doc
- 第1章 AutoCAD基础知识与基本操作.ppt
- 第1章-人工智能概论.ppt
- 广东省汕尾市2024-2025学年高二下学期期末考试政治试题(含解析).pdf
- 广西钦州市第十三中学2024-2025学年高一下学期期末热身考试政治试卷(六)(含解析).pdf
- 2024-2025学年广东省汕尾市海丰县人教版三年级下册期末考试数学试卷.pdf
- 2024-2025学年辽宁省鞍山市立山区人教版三年级下册期末考试数学试卷(含部分答案).pdf
- 黑龙江省齐齐哈尔市铁锋区2025年中考三模语文试题(含答案).pdf
- 广西壮族自治区钦州市浦北县2024-2025学年八年级下学期期末历史试题(含答案).pdf
- 河北省沧州市部分学校2024-2025学年高二上学期9月月考历史试卷(含答案).pdf
- 2024-2025学年广东省肇庆市四会市人教版三年级下册期末考试数学试卷(含答案).pdf
- 2024-2025学年海南省三亚市人教版三年级下册质量检测数学试卷(含答案).pdf
- 甘肃省靖远县第四中学2024-2025学年高三上学期期末考试历史试题(含答案).pdf
文档评论(0)