- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 文献数据库与计算机检索讲解材料.ppt
文献数据库与计算机检索
1. 文献信息数据库
2. 计算机信息检索基础
3. 检索效果评价及其优化
1. 文献信息数据库
文献是记录知识的载体。数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合 。当数据库记录的对象为文献信息时,就称为文献信息数据库 。
文献信息数据库的结构
一个数据库通常由一个主文档(Master File)
和若干个索引文档或称倒排文档(Inverted File)
组成。
文档——是具有某种特征的全部记录的集合。
记录——是构成文档的基本单元,由各种反映
文献特征的字段组成。如一篇论文、一件专利、
一本图书、一个标准的相关信息都能够成为文
档中的一条记录。
字段——是记录的基本组成元素。一条记录的
常见字段通常包含题名字段、著者字段、主题
词字段、文献出处字段(如刊名等)多种字段。
文献数据库中常见的字段和段码
2018-5-20
文献数据库的类型
按数据库文献记载的详细度可分为——
书目型数据库(二次文献数据库):仅提供文献检索,读者根据其提供的线索查找文献原文。
可以分为:题录型 文摘型
EI SCI 中国科学引文索引
文献数据库的类型
按数据库文献记载的详细度可分为——
全文数据库:不仅提供文献的基本信息及线索,同时还提供原始文献本身的数据库。主要包括全文数据库、术语数据库、图像数据库等等。
如: CNKI 万方 Elsevier IEL
文献数据库的类型
按数据库文献记载的详细度可分为——
混合型数据库:数据中的数据,一部分只是提供参考数据库中的信息(文献的基本情况及线索);另一部分则可以提供全文数据库中的信息(原始文献本身)
。如: EBSCO (ASP\BSP)
文献信息数据库的评价标准
①收录内容范围——系统准确。
②揭示文献详略——完备详细。
③更新速度快慢——及时快速。
④检索字段多寡——途径丰富。
⑤检索功能强弱——高效完善。
⑥用户使用方便——易学易用。
⑦维护服务质量——及时到位。
计算机信息检索基础
计算机信息检索——指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。
随着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。
计算机信息检索发展过程
脱机检索阶段(50年代中期到60年代中期)
联机检索阶段(60年代中期到70年代中期)
光盘数据库检索阶段(70年代中期到80年代末)
网络化检索阶段(90初年代至今)
1)分析检索课题,明确检索要求
(2)选择适当检索系统(数据库)
(3)确定检索途径及检索词
(4)构建检索提问式
(5)上机检索并调整检索策略
(6)输出检索结果 (具体)
计算机检索的一般程序
计算机检索的一般程序
主题分析
明确检索需求及检索目标
(1)检索信息的学科范围
(2)检索信息的类型
(3)检索的目的
选择检索系统(数据库等)
(1)根据检索目的确定所需数据库的类型
(2)根据信息需求的内容、专业范围选择数据库
(3)根据记录来源选择数据库
(4)根据熟悉程度选择数据库
计算机检索的一般程序
主题概念分析(注:是课题检索的重点和难点)
检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等)
文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等)?结果形式(全文、文摘、题录、数值、事实等)
检索年限(如2000年以来的文献)
语种(中文、外文;英文、日文)
检索结果数量(100?50?)
2.计算机检索基本技术
布尔逻辑检索技术
布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。
常用算符及含义:AND (*) OR (+) NOT (-)
布尔逻辑检索技术
AND (*)——
接不相容的主题概念(或不同字段)
检索结果同时出现连接的词
限定, 缩小范围, 提高准确率。
OR (+)——?连接同义词 ,同族词, 相关词
检索结果至少含有其中一词或同时有
扩大,检索范围, 提高查全。
NOT (-)——
缩小检索范围,起到减少文献输出量。
布尔逻辑检索技术
优先处理算符“( )”
逻辑算符OR和AND的使用方法,如果归纳成一个模式,比如有A、B、C、D四个检索词(其中A和B,C和D分别为同义概念),
检索提问式为:(A OR B)AND (C OR D)
即,同一组检索提问既含有OR算符,又含有AND算符,此时须使用优先处理算符“( )”,将OR算符前后的词放入括号中,计算机将优先运算括号
文档评论(0)