2第二讲信息检索基本原理与方法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
检索实例 3 确定检索途径(以中文科技期刊数据库为例) 检索实例 4 实施检索 检索实例 5 筛选文献 检索实例 5 获取全文 五、小结 * 确定检索词及构建检索提问式的方法 ① 了解“碳纳米管在电极中的应用” 情况; ② 查找有关“山楂的食品加工”文献; ③ 查找有机锡、有机锑类的塑料热稳定剂资料; ④ 煤灰利用; ⑤ 用生物方法防治棉铃虫(排除用赤眼蜂)的文献。 本讲重点内容 * 确定检索词及构建检索提问式的方法 比较下列检索式的区别: ①(工业+农业+工农业)* 废水 * 循环利用 ② 工业+农业+工农业 * 废水 * 循环利用 本讲重点内容 * 掌握了信息检索的原理,就有必要了解信息检索的类型。按照不同的标准,信息检索可划分为不同的类型,其特点也各自不同。 (一)依检索内容划分 1.文献信息检索(Document Retrieval) 凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。其检索的结果是文献信息。例如,“设计人行天桥的参考文献有哪些?”便属于该类命题。 2.数据信息检索(Data Retrieval) 凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。其检索结果为数据信息。例如,“某一新型载货汽车的载重量是多少?百公里油耗是多少?”就属于数据检索。 3.事实信息检索(Fact Retrieval) 凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。其检索结果是基本事实。例如,“世界上最长的斜拉桥是哪座?该桥位于什么地方?何时建成?”等。 文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。 (二)依信息存储和检索的方式和技术划分 1.手工检索(Manual Retrieval) 手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。其使用的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各类工具书。检索过程是由人工以手工的方式完成的。 2.计算机检索(Computer-based Retrieval) 计算机检索简称“机检”,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行的信息存储和检索,其检索过程是在人机的协同作用下完成的。计算机会从其存储的大量数据中自动分拣出与用户提问相匹配的信息,而用户则是整个检索方案的设计者和操纵者。其检索的本质没有发生变化,发生变化的只是信息的载体形式、检索手段、存储方式和匹配方法。 计算机的产生使信息检索发生了革命性的变化,大大提高了信息的处理和检索能力。不过计算机检索有很强的技巧性,用户需要具备一定的“机检”知识(详见第六篇)。 截词检索主要是利用检索词的词干或者不完整的词形进行检索,其作用是可扩大检索范围,提高文献的查全率。常用的截词符号有“?”“$” 和 “*” 等。截词检索中使用的截词方式主要有后方截词、前方截词、前后截词和中间截词四种。 文献检索基本步骤 - 截词检索 后方截词:comput* 可检索computer、computers、computing 等 前方截词:*computer可检索 computer、microcomputer等 前后截词: ?大学?可检索北京大学学报、北京科技大学学报等 中间截词:wom?n 可检索woman、women等 文献检索基本步骤 - 截词检索 1〉(W)、(nW) W:检索词之间不得插入任何词,顺序不能颠倒。 如:Al(W)Si(W)Alloy nW:检索词之间可以插入词,顺序不能颠倒。 如:electric(1W)vehicles 文献检索基本步骤 - 位置算符 规定检索词在原始文献中相对位置的符号,主要有W、nW、N、F、S等。 2〉(N)、(nN) N:算符两侧的检索词必须紧密相连,中间不能插 入其他词,顺序可以颠倒。 如:Chemistry(N)Physics nN:算符两侧的检索词中间可以插入最多n个其他 词,顺序可以颠倒。 如:computer(2N)system 文献检索基本步骤 - 位置算符 3〉(S) S:表示其两侧的检索词必须是在文献记录的同一子字段中 ,且不限制它们在该子字段中的相对次序和相对位置的 距离。在文

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档