4信息检索原理及技术.ppt

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
作业3 分别利用清华同方《中国期刊全文数据库》、万方数据《学术期刊》、维普资讯《中文科技期刊数据库》检索所在院系任意一名教师在2006年以后发表的研究论文,下载其篇名、作者、期刊刊名及卷、期信息。并评价三个数据库的检索过程与结果。 维普数据库 源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》 数据来源:1989年至今的8000余种期刊刊载的2000余万篇文献,并以每年180万篇的速度递增。 分类体系:按照《中国图书馆分类法》进行分类,所有文献被分为8个专辑:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。 采用国际标准的PDF全文数据格式 传统检索 模糊检索与精确检索 精确检索 高级检索 高级检索同义词库使用 高级检索同名作者库使用 专家检索(直接输入检索式) 分类检索 维普数据库的特点 维普数据库的分类检索可以提供多个不同学科的交叉类目检索 维普数据库除了具有一般检索功能外,还具有同义词库、同名作者库,用来提高查全率和查准率。 值得注意的是,同义词功能只适用于三个检索字段:关键词、题名或题名与关键词; 同名作者功能只适用于两个检索字段:作者、第一作者。 万方数据库 1) 概况 是由中国科技信息研究所、万方数据集团公司开发的网上数据库联机检索系统。 2) 收录特色 以科技信息为主,也包括经济、金融、社会、文化、教育、卫生等各行业期刊。 3) 我馆资源 我馆有访问权限的万方资源有数字化期刊、科技信息、中国学位论文全文数据库、中国学术会议论文全文数据库、中国标准数据库。 万方数据资源系统 数字化期刊:万方数据共收录期刊约6000种,覆盖哲学政法、社会科学、经济财政、教科文艺、基础科学、医药卫生、农业科学、工业技术等八大类别。 中国学位论文全文数据库:该库由国家法定学位论文收藏机构——中国科技信息研究所提供,并委托万方数据加工建库,收录了自1980年以来我国自然科学领域博士、博士后及硕士研究生论文,其中学位论文全文超过152万篇。 中国学术会议论文全文数据库:主要收录1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文,数据范围覆盖自然科学、工程技术、农林、医学等领域。 中国标准数据库(2006年后未更新):标准是在一定地域或行业内统一的技术要求。本库收录了国内外的大量标准,包括中国国家发布的全部标准、某些行业的行业标准以及电气和电子工程师技术标准;收录了国际标准数据库、美英德等的国家标准,以及国际电工标准;还收录了某些国家的行业标准,如美国保险商实验所数据库、美国专业协会标准数据库、美国材料实验协会数据库、日本工业标准数据库等。 信息检索原理与技术 信息检索原理与技术 1、信息检索的基本原理 信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下: 信息检索点 1)分类检索(classification) 2)主题检索 3)作者检索 4)名称检索 5)号码检索 图书期刊的号码 ISSN号: 2、计算机信息检索技术 初级检索技术 A. 逻辑运算 B. 截词检索 C. 位置检索 D. 检索字段控制 A. 逻辑运算(布尔算符) 用来表示两个检索词之间的逻辑关系,常用的有三种;逻辑(and) 、逻辑或(or)和逻辑非(not)。这里用A和B分别代表两个检索词,它们的逻辑关系由下表和图说明。 在逻辑算符中,其运算优先级顺序一般为:NOT、AND、OR。但可用括号改变它们之间的运算顺序。应先运算括号内的式子。 B. 截词检索 截词符也称通配符, 用来对检索词(干)进行扩展。其作用是减少检索词的输入而保证相关检索概念的涵盖,同时也方便解决语言文字拼写方面的差异(如美式英语和英式英语),避免漏检。 C. 位置检索 位置算符(proximation operator),表示其连接的两个检索词之间的位置关系,常用的有(W), (nW), (N), (nN), (L), (S), (F)等。 D.检索字段控制 检索字段符是对检索词出现的字段范围进行限定,执行时,机器只对指定的字段进行检索,经常应用于检索结果的调整。 检索字段符分作两类:后缀式和前缀式。后缀式对应基本索引, 如标题、文摘、关键词等,反映文献的主题内容;前缀式对应辅助索引,如语种、出版年、分类号、机构等,反映文献的外部特征,用“=”连结。 D.检索字段控制 例如:(minicomputer/DE OR personal computer/ID)AND PY=2002 这个检索式所表达的检索要求是:查找2002年出版的关于微电脑或者个人电脑的文献,并要求“微电脑”一词在命中文献的叙词字段出现

文档评论(0)

187****5045 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档