- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云南大信息学院《信息检索》复习大纲
第1章 信息资源概论
1、信息资源的涵义
信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
2、信息资源的类型及各自的特点
信息资源基本特征:
(1)共享性 (2)时效性 (3)智能性 (4)无限性与有限性并存 (5)增值性
类型: 我们将信息资源区分为纸质文献型信息资源和电子型信息资源(包括电子出版物、网络信息资源)两大类型。
第2章 信息存储与检索基础
1、信息存储与检索的基本原理
采用多种形式记录信息、排序信息的信息存储过称同时通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与活动。(信息检索的基本原理:为了促进信息资源的充分交流和有效利用,使用户在信息集合中快速、精确、全面地获得特定需要的信息资源,必须要对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储,以建成各种信息存取系统。用户则根据检索需要,将需求转变为系统所能识别的检索式,再与存取系统中表征信息资源特征的标识进行逐一的相符性匹配与比较,两者完全一致或部分一致时,即为命中信息,可按用户要求从存取系统中输出。)
2、信息存储与检索的历程
信息存储与检索走过了文献检索、情报检索的历程,并且正在向着知识检索的领域迈进:
3、信息检索通常包括的四种类型
关于文献的检索
关于某事实或事项的知识检索
关于数值或数据的情报检索
关于图像信息的信息检索
4、索引的概念
索引(Index)是存取信息资源“地址”或“出处”的标识系统,是信息存储与检索的基本形式。索引的基本功能是指示知识点在正文或文献款目中的位置。传统的文本式检索工具通常由两部分组成,即文摘正文部分和辅助索引部分。
索引就是将信息集合中具有检索意义的事物名称及特征(如篇名、人名、书名、刊名、网页、网站、地名、分类号、主题词、分子式、专利号、报告号、名词术语等)抽取出来,著名其地址,按照字顺或逻辑分类等次序组织款目,从而为用户提供查询线索的存取工具。
5、索引的款目结构中,例如
未来的地球人①/王佃亮② 31③
①②③分别代表什么
(索引款目一般由索引标题词、说明语和地址参照项组成,而简单的索引款目往往只有索引标题词和地址参照项两部分内容)
①代表索引标题词②代表说明语(作者)③地址参照项(页码,文件顺序号)
6、引文索引的概念
把一系列具有引用与被引用关系的科学文献以多向线性的方式联系起来,提供一个以引证关系为依据来检索文献的新途径。引文索引的主要职能是,回答某作者的论文曾经被哪些人的文章所引证,这些文章何时发表在何种刊物上。
第3/4章 信息存取途径与检索策略
1、布尔逻辑算符
用户利用逻辑算符构造检索式,可将一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND、OR、NOT,故简称为布尔逻辑组配算符。这三种算符表示不同的逻辑关系,在构建提问检索式时必须正确选择使用。
逻辑“与”——AND或*
逻辑“或”——OR或+
逻辑“非”—NOT或-
布尔逻辑算符的优先执行顺序为NOT、AND、OR。
由布尔逻辑算符连接而成的检索式称为逻辑检索。
2、位置逻辑算符
由于布尔逻辑算符不能限定检索词在检索记录中的位置关系,因此其检索结果常常不能满足精确检索的需要。为了弥补逻辑算符准确表达提问要求的缺陷,提高检索效率避免误检,特规定了一些位置算符。也就是当使用文献记录中的自由词作为检索词进行检索时,词与词之间的逻辑关系则用位置算符组配。位置算符主要用于全文数据库查询。
位置算符不仅可用来组配带有前缀或后缀的检索词,也可用来组配带有逻辑算符的检索式。常用的位置算符有下列几种
①(W)或( )—with
②(nw)表示在此算符两侧的检索词之间允许插入n个实词或虚词,两个检索词的词序不允许颠倒。
③(N)—“Near”
由(N)连接的检索词在记录中出现的顺序可以调换,但必须彼此相邻。
④(nN)
表示算符两侧的检索词(或称检索项)之间允许插入n个词,且两检索项的位置可以调换。
⑤(F)—Field
表示算符两侧的检索词,必须同时出现在文献记录的同一字段中,如同一文摘或同一标题字段,同一题名字段等,此文便为命中,算符两侧检索词词序不变,夹在其间的其它词数量也不限。
⑥(S)—Sub field
表示算符两侧的检索词必须同时出现在文献记录的相同子字段内,其检索词的顺序不限、夹在其间的词汇数量也不限,子字段通常由数据库确定。
⑦(L)—Link
(L)算符通常用来表示算符两侧的检索词是从属关系,前者为上位概念,后者为下位概念;或算符左侧为主叙词,右侧为副叙词。
⑧(C)—CITATION
表示算符两侧的检索词可以不分字段、不按顺序,只要同时出现在一篇文献记录中即为命中
您可能关注的文档
- 乌兹别外经部机构组成.doc
- 义乌小品批发市场经营特色.doc
- 义乌小品专业批发市场的潜力.doc
- 义乌小品批发市场_1482096268.doc
- 乐外卖信外卖系统使用教程之商品属性说明.doc
- 义乌玩暨小商品批发市场.doc
- 乔姐谈对象.ppt
- 义百利乌小商品直销超市加盟流程.doc
- 义乌小品批发市场简介.doc
- 义乌小品批发市场.doc
- 白天晚上教学课件.ppt
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题带答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解一套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及完整答案详解1套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解1套.docx
- 2025年山东菏泽市事业单位招聘急需紧缺岗位目录(第一批)笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及答案详解1套.docx
- 画西瓜教学课件.ppt
文档评论(0)