- 1、本文档共105页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;;;;本节任务
通过3个学习任务介绍信息检索,包含信息检索基础知识、搜索引擎使用技巧、专用平台信息检索等内容。;01;信息检索的原理:
信息检索的原理是将读者(用户)的信息需求与存储在信息集合体中的信息进行比较和选择,来进行匹配的过程,即对信息集合与需求的匹配和选择。
广义的信息检索包括信息的存储和检索两个过程。信息的存储就是将搜索到的一次信息,经过著录其特征(如题名、著者、主题词、分类号等)而形成款目,并将这些款目组织起来成为二次信息的过程。信息的检索是针对已存储好的二次信息库进行的检索,是存储的逆过程。存储是为了检索,而为了快速而有效的检索,就必须存储。没有存储,检索就无从谈起。这是存储与检索相辅相成、相互依存的辩证关系。;01;信息检索的原理
由于职业、知识水平、个人素质,甚至习惯等因素的差异,信息存储人员(标引者)与信息检索用户(检索者)对同一信息的分析、理解也会存在不同。
例如,《计算机在生物化学中的应用》一文,标引者可能将其归为“生物化学”类,而检索者则可能在“计算机”类查找该文。这样,标引者与检索者之间发生了标引错位,存储的信息就无法被检索到。
怎样才能保证信息能存储且能取出呢?那就是存储与检索所依据的规则必须一致,也就是说,标引者与检索者必须遵守相同的标引规则。
;信息存储与检索共同遵循的规则称为信息检索语言。只要标引者和检索者用同一种检索语言来标引要存入的信息特征和要查找的检索提问,使它们变成一致的标识形式,信息的存储过程与检索过程就具备了相符性。相应地,存入的文献也就可以通过信息检索工具(系统)检索出来。
如果检索失败了,就要分析检索提问是否确切地描述了待查课题的主题概念,在利用检索语言标引时是否出了差错,从而导致检索提问标识错误。只有检索提问标识和信息特征标识一致时,相关的文献才能被检索出来。;信息检索正是以信息的存储与检索之间的相符性为基础的,如图所示。如果两个过程不能相符,信息检索就失去了基础。检索不到所需的信息,存储也就失去了意义。;信息检索的???类
1.按存储与检索对象划分
;2.以存储的载体和实现查找的技术手段为标准划分
;2.以检索途径划分;信息检索的定义
1.检索工具的定义
检索工具是用来报道、存储、查找、汇集各种信息,按特定的方法加以描述和编排,以供查考的工具。
检索工具与普通文献的主要区别在于:它是一种工具书刊,是专供人们查找特定信息的,虽然它也具备可读性,但它不是供人们进行系统阅读的。;2.检索工具的类型
1)按检索工具的出版形式划分;2)按检索工具的基本作用划分;3)按检索工具的内容与功用划分①;3)按检索工具的内容与功用划分②;4)按检索工具的收录范围划分;常用的网络信息检索技术
1.信息检索技术的发展
目前,信息检索技术正向两个方向发展:一是传统信息检索向全文检索和基于内容的多媒体等新型信息检索发展,在深度上能对提问的内容进行分析和理解,提高查准率,探索自动抽词、自动索引、自动检索、自动文摘、自动分类、自动翻译等解决方案,提高管理和组织信息的能力;二是信息资源的网络化分布,面对Internet中浩瀚无垠的资源,提高查全率,以及基于概念的信息检索和基于内容的信息检索与超文本网络信息检索系统的研究。;2.布尔逻辑检索
布尔逻辑检索是指利用布尔逻辑运算符来连接各个检索词,再由计算机进行相应逻辑运算,以找出所需信息的方法。布尔逻辑检索是使用频率最高的检索技术。
(1)分类。通常,应用于检索的布尔逻辑运算符有“与”“或”“非”3种。
①“与”——逻辑乘。用于组配具有交叉和既定关系的概念,用AND表示。
②“或”——逻辑和。用于组配具有同义和并列关系的概念,用OR表示。
③“非”——逻辑差。用于排除某种概念关系的组配,用NOT表示。
;(2)布尔逻辑的运算次序。布尔逻辑的运算次序为逻辑非(差)→逻辑与(乘)→逻辑或(和),若有括号,则括号优先,这与算术中的四则运算相似。布尔逻辑的运算也可以进行同类项合并等。例如:
①A+B=B+A,A-B≠B-A。
②检索“狂犬病的诊断及防治”方面的文献,可以编写检索语句“(狂犬病NOT伪狂犬病)AND(诊断OR防治)”。;3.截词检索
截词检索是预防漏检、提高查全率的一种常用检索技术。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。
截词检索即利用检索词的词干或不完整的词型进行检索。常用的截词符有“?”“$”和“*”等,不同的检索系统所采用的截词符会有不同,其中,“?”表示截断一个字符,“*”表示截断多个字符。截词检索可按以下方式进行分类:;1)按所截断的字符数目划分;2)按截断的位置来划分;4.位置检索
在一个文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中
您可能关注的文档
- 生物药物分离技术:生物药物分离技术导论PPT教学课件.pptx
- 生物药物分离技术:细胞色素C的凝胶层析PPT教学课件.pptx
- 生物药物分离技术:细胞色素C的提取PPT教学课件.pptx
- 生物药物分离技术:细胞色素C提取液的中和PPT教学课件.pptx
- 生物药物分离技术:细胞色素C洗脱液的盐析PPT教学课件.pptx
- 生物药物分离技术:细胞色素C原材料的预处理PPT教学课件.pptx
- 信息技术(Windows 10+Office 2016):Excel 2016电子表格处理PPT教学课件.pptx
- 信息技术(Windows 10+Office 2016):PowerPoint2016演示文稿制作PPT教学课件.pptx
- 信息技术(Windows 10+Office 2016):Word 2016 文档处理PPT教学课件.pptx
- 信息技术(Windows 10+Office 2016):新一代信息技术PPT教学课件.pptx
文档评论(0)