- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索复习 文献的分类 文献按其加工深度不同可以分为零次文献、一次文献、二次文献和三次文献。 文献按其载体形式的不同可分为书写型、印刷型、缩微型、声像型、数字型 。 连续出版物的主要类型有报纸、期刊、年度出版物三种。 学位论文 学位论文是高等学校和学术研究机构的学生为获得学位而撰写的学术论文,包括学士论文、硕士论文和博士论文,它们具有独创性、专业性和知识性的特点。 文献 根据文献反映新内容的程度从大到小的顺序为:会议论文、科技期刊、科技报告、科技图书 一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:标题关键词文摘正文 文献的特征(检索的途径) 文献主要有两方面的特征,其中外部特征包括:文献题名( 篇名、书名、刊名) 、责任者( 个人、团体) 、文献代码( 专利号、ISBN号)、出版时间、出版地、版次、引文等等;文献的内容特征主要是文献的主题与学科分类 各种检索途径中,分类途径和主题途径是从文献的内容特征入手来查找文献,作为主要的检索途径,分类途径和主题途径各有特点。前者以学科体系为基础,按分类编排,学科系统性好,适合于族性检索;后者直接用文字表达主题,概念准确、灵活,直接性较好,适合于特征检索。而作为辅助途径的其他检索途径是以文献外部特征 进行检索,其优点是它的排列与检索方法以字顺或数字为准,比较机械、单纯,不易错检或漏检。因而适用于查找对已知篇名(书名、刊名)、作者姓名或序号数码的文献,可直接判断该文献的有或无。 信息检索的概念 广义的信息检索是指将大量分散、无序的信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程,包括信息的存储与检索两个方面。 信息检索的原理 信息检索的原理就是将需要查找的信息转换为检索系统能够识别的检索提问标识,然后通过与检索系统中的信息存储标识进行匹配比对,将与提问标识一致的信息记录提取出来就是检索的命中信息。 信息检索的工具 检索工具是指人们用来报道、存储和查找各类信息的工具。它是检索标志的集合体,具有存储和检索的功能。 信息检索语言 信息检索语言是根据信息存储和检索需要而创造的沟通信息存储人员和信息检索者双方思想的一种人工语言,也称为信息标识系统。 检索语言的作用 1、标引文献信息内容及其外表特征,保证不同信息处理人员表征信息的一致性; 2、对内容相同及相关的文献信息加以集中或揭示出其相关性,形成信息的有序集合,使文献信息集中化、系统化、组织化,便于检索者按照一定的排列方法进行有序化检索; 3、便于将信息标引符号和检索符号进行相符性比较,保证不同人表述相同信息内容的简洁性和一致性,以及检索人员与标引人员对相同信息内容表述的一致性; 4、有利于检索者按不同需要灵活设置和判断信息内容与检索要求之间的关联度,从而获得最佳查全率与查准率 检索语言 表述文献内容特征检索语言可分为两大类:分类语言和主题语言 《中国图书分类法》(简称《中图法》)将图书分成 5大部分22个大类 信息检索的策略 广义的检索策略是指为实现检索目标而制定的全盘计划和方案,包括分析课题,选择检索系统、数据库,确定检索入口和检索词,以及检索词其相互间的逻辑关系等一系列的科学措施。 狭义的检索策略是指检索式,是用来表达用户检索提问的逻辑表达式,是检索策略的综合体现。 信息检索的步骤 信息检索包括五个步骤:分析待查课题、选择检索工具(检索系统)、确定检索途径和检索标识、构建检索提问式、查找文献信息线索,索取原文 。 构建检索表达式常用的运算方式 在计算机信息检索系统中,常用的检索运算方式主要有布尔逻辑运算、截词运算、位置运算、限制运算等。 截词检索:就是用一个词的局部作为检索标识进行信息检索,只要信息存储系统中有信息的标识符能和这个“局部”匹配,那么这个信息就为命中信息。 检索的方法 在实际检索中,究竟采用哪种方法检索最合适,应根据检索条件、检索要求和检索背景等因素确定。检索条件是指是否有充分的检索工具可利用,在没有检索工具的情况下,可采用追溯法为主的检索方法。检索要求是指查准、查快、查全。这三者之间是互相制约的,难以兼得。若要求以“查全”为主,则应采用顺查法或循环法;若要求以“查准”为主,则应采用倒查法;若要求以“查快”为主,则应采用抽查法。检索背景是指待查课题所属学科发展情况,即该学科从何开始研究,何时研究达到高峰,何时研究处于低谷等。若能准确地知道此背景情况,可采用抽查法为主的检索方法。 信息检索的评价指标 查准率:是指利用检索系统(工具)进行某一检索时,检出的相关信息记录量与检出文献总量的比率。 查全率:是指利用检索系统(
文档评论(0)