第二讲 信息检索基础教学知识.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲 信息检索基础教学知识.ppt

第二讲 信息检索基础知识 ;信息检索基础知识;一、信息检索概念与原理;1.1 信息检索的概念;1.2 信息检索的原理 ;1.3 信息检索的类型;1.4 信息检索方法; 1.4.2 回溯检索法 回溯检索法又称追溯法、引文法、引证法,是一种跟踪查找的方法。这种检索方法不是利用确定的检索工具,而是利用已知文献的某种指引(如文献附的参考文献、有关注释、辅助索引、附录等)追踪查找文献。 用追溯法检索文献,最好利用与研究课题相关的专著与综述。 在检索工具不全或文献线索很少的情况下,可采用此法。 ;引文法;中国知网 /; 1.4.3 循环检索法 循环检索法又称交替法、综合法、分段法。检索时,先利用检索工具从分类、主题、责任者、题名等入手,查出一批文献;然后选择出与检索课题针对性较强的文献,再按文献后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,直到满意为止。 ; 检索语言(retrieval language)是文献信息标引和检索提问而约定的人工语言。 检索语言是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。 ——在存储的过程中用于标引信息称为标引语言; ——用于编制索引就称为索引语言; ——用于信息检索则称为检索语言。 ;检索语言类型; 分类语言(classification retrieval language) 是以知识的学科体系为基础,以符号(数字、字母)为概念标识进行文献内容特征揭示的一种检索语言。它以学科类目名称作为基本词汇,通过类目的从属关系来表达复杂的概念。 ; 分类法:以知识属性来描述和表达文献内容特征的方法称为分类法。常用于图书资料的分类和排架。 一、中国图书馆分类法 二、中国人民大学图书馆分类法 三、中国科学院图书馆图书分类法 四、 杜威十进分类法 (DDC) 五、国际十进分类法 (UDC) 六、美国国会图书馆图书分类法 (LCC); 中国图书馆分类法 ;中国图书馆图书分类法;读者实际利用图书馆时,往往需要知道书刊的分类号和索书号(又称索取号)。 ??书号是图书馆赋予每一种馆藏图书的号码,是读者查找图书非常必要的代码信息。它的第一部分是分类号,第二部分是书次号。 索书号的两部分之间有一个空格或一条斜线“/”。书次号或者是按照图书作者姓名所编排的著者号码,或者是按照图书进入馆藏时间的先后所取用的顺序号码。 ;分类号和索书号;超星数字图书馆;杜威十进分类法: 000 总类 100 哲学类 200 宗教类 300 社会科学类 400 语言类 500 纯科学类 600 应用科学类 700 艺术类 800 文学类 900 地理历史类;主题语言是一种描述性语言,它用语词直接表达信息的主题,这些语词就是表达主题概念的标识,将这些作标识的语词按字顺排列并使用参照系统来间接表达各种概念之间的关系。 【什么是主题】 主题“是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题”,即文献的“中心内容”。 【什么是主题词】 表达主题概念的词汇就是主题词。 狭义的主题词仅指叙词 ; 广义主题词可以分为规范词汇和自由词汇,包括关键词、主题词、标题词、叙词。 ; 主题语言又分为标题词语言、单元词语言、叙词语言和关键词语言,前两种语言目前使用较少。 1)叙词语言:叙词是为了适应计算机检索的需要产生的。它对自然语言中的“多词一义”的词汇进行规范,保证一个叙词只对应一个概念。它是从文献题目、正文或摘要中抽取出来的,经过规范化的基本概念单元词。 如:课题: 太阳能热水器研究 汉语主题词表中正式主题是太阳能利用、太阳能加热等代替。 ; 2)关键词语言 关键词是指直接从文献的标题、正文或摘要中直接提取未经规范化具有实质意义的词或词组,一般由著者给出。关键词语言就是将文献中的一些主要关键词抽出作为检索标识,并以字顺排列组成的查找文献用的语言。 一般通用词(技术、理论、应用等)以及无实质意义的词(冠、接词、连词等)不作关键词使用。;青岛工学院图书馆03/;三、信息检索技术;检索方式;3.1 布尔逻辑检索;逻辑与(AND ) 用于交叉概念或限定关系的组配,可以缩小检索范围,提高查准率。 可使用“*”或“&”来表示。 其检索表达式为:“A AND B”或“A*B”,即检索记录中必须同时包含A词与B词才

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档