数据库检索基本原理和方法.pptVIP

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
检索词确定后,根据课题内容,组配检索词,确定各个检索词之间的合理的逻辑关系,构成正确的检索式 要注意检索的逻辑组配关系,要考虑检索式与检索词之间以及检索式之间的可能组配,扩展与限制检索 把握概念的网罗度与专指度的关系 因数据库而异 (B)构好检索式 一般来说,每个数据库都有多个检索途径,常用的有:篇名、作者、关键词、摘要、全文、出处、分类等 检索前用户要告诉计算机,以什么检索途径来进行检索。如果要查找篇名中含有某个词的文献,则检索途径选择“篇名”;如果要按文献的分类来检索,则检索途径选择“分类” (C)选择检索途径 文献量适中 文献量太多 文献量太少(甚至0) 造成检索结果为“0”的原因,可能是在检索过程中,由于检索词选择不当或组配不正确,检索工具确定不恰当和检索途径单一等,而导致检索结果的错误 (5)评价检索结果 检索途径限制 掌握各种方法 标引深度限制 减少检索词 文献种类限制 选用合适信息源 检索系统限制 1)选词不当 2)组配不当 3)逻辑算符选用不当 4)系统选用不当 5)时段估计不当 漏检和误检的原因分析  在检索时为了防止漏检,应采用广种薄收的方法,检索多达8—15个数据库,在检索时应先选择专业库,后选综合库    在“维普”中查找 “变频空调” 检索策略 命中篇数 变频AND空调 968 变频OR空调 32861 变频/ti AND空调 762 变频空调 394 变频空调/ti 265 扩检(提高查全率) √降低检索词的专指度,用上位词或相关词放宽检索 √使用关键词索引时,可通过增加同义词、近义词等增加命 中文献数,也可通过截断符减少由于拼法不同或词尾不同 而造成的漏检 √增加待检的检索工具与数据库,多种索引配合使用 缩检(提高查准率) √提高检索词的专指度 √用逻辑乘连结一些进一步限定主题概念的相关检索项 √用逻辑非排除一些无关的检索项 √利用文献的外表特征(文献的类型、语种、出版年代等) 限制输出的检索结果 √限制检索词出现的可检索字段,并指定邻接和优先关系 (6)调整检索策略 审题把握重点 查综述性文章把握宏观和理解内容 检索词和数据库宜专 检索式先紧密后松散 主题放在标题中 检索词不要太多,特别是可能在原文中出现的检索词 找出一篇最相关的文献,进一步斟酌检索策略 检索技巧总结 检索系统进行检索时产生的有效结果 它直接反映了检索系统性能的好坏 衡量检索效果的指标 查全率(recall ratio) 查准率(precision ratio) 3、检索效率 检索出的相关文献量 数据库中的全部相关文献 查全率R= x100% 检索出的相关文献量 检出的文献总量 查准率P= x100% 最理想的检索结果是查全率和查准率都达到100%。 R?100%表示数据库中收录的全部相关文献都被检索出来 P?100%表示检索出来的文献全部都是相关文献 但事实上,检索中有许多因素使这个指标很难达到。 R 0 P 查全率R与查准率P的关系曲线 C A D B C.W.Cleverdon(英)进行 Granfield试验,得出 查全率R与查准率P曲线 ?R-P之间存在着互逆关系 ? A点 检索词数量多,泛指性强, 查全率较高但查准率却非常低 ?B点 检索词专指性较强,查准率就高 查全率因此降低 ? C,D两点 两种极端的折衷。 查全率一般在60%--70% 查准率一般在40%--50% ?无论怎样调整检索策略和改进系 统效率,都无法使P和R同时接近100%。 找出满足需要的文献  核心——查准  兼顾——查全 正确把握查全率和查准率的关系。在准的基础上尽量求全,以便比较、借鉴和参考 合法用户:通过IP地址控制,所有校园网用户均为合法用户 适度下载 一个帐户连续不断下载同一数据库全文不超过30篇 确有需要,可以分时进行 尊重知识产权,合理利用数据资源 禁止用智能下载工具恶意下载 “恶意下载”具体指三种行为: 整本下载电子图书或者整卷、整期下载期刊论文; 在下载过程中,使用了智能下载工具; 短时间内大批量集中下载同一数据库的文献 全文网络数据库的使用许可协议书明文规定,严格禁止使用任何自动下载软件、智能机器人下载工具(如 NetAnt,Flashget(Jetcar),DLExpert, Getright等) 数据库厂商一般都实行每天24小时、每周7天不间断对用户使用情况进行监控,当一个IP在一分钟内发出下载请求超过45次/篇时,将被监控系统视为使用了自动下载工具进行违规操作 违规使用并恶意下载的后果 停止违规使用IP的使用权; 停止我校所有IP的使用权; 大幅度涨价; 诉诸法律。 1、用维普、万方、EI 、Sp

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档