第二讲 信息检索原理.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲 信息检索原理;第一节 检索语言 ; 二、检索语言的类型;3.1.按照表述文献外表特征可分为: ? 题名----题名索引 著者----著者索引,机关团体著者索引 报告号索引 文献编号 合同号索引 存取号索引 其它----人名索引,引用文献目录等?; 3.2.按照表达文献内容特征可分为: ? 体系分类语言----分类索引 标题词语言 统称主题索引 叙词语言 关键词语言----关键词索引 其它 ----分子式,结构式索引等;4.分类语言 主要包括体系分类法和组配分类法 (1)体系分类法:等级列举式分类法 国内常用的分类法: 《中国图书馆分类法》 (简称《中图法》) 《中国科学院图书馆图书分类法》 (简称《科图法》) 《中国人民大学图书馆图书分类法》 (简称《人大法》) 《中国图书分类法》(港台);;国外常用的分类法: 《国际十进分类法》 (Universal Decimal Classification, 简称UDC) 《杜威十进分类法》 (Dewey Decimal Classification, 简称DDC) 《美国国会图书馆图书分类法》 (Library of Congress System, 简称LC);; A 马克思主义、列宁主义、毛泽东思想、邓小平理论;F 经济 ………………… … … 一级类目 F0 经济学…………………… 二级类目 … … F6 邮电经济……………………二级类目 F60 邮电经济理论 …………… 三级类目 F6O6 邮电企业组织与经营管理…四级类目 F606.1 组织机构…………… 五级类目 …… F7 贸易经济 ………………… 二级类目; (2) 组配分类法 分面分类法或分面组配分类法,先组式信息检索语言 印度图书馆学家阮冈纳赞创制的 《冒号分类法》(简称CC)。;5.主题语言 叙词、关键词、标题词、单元词四种。 (1)叙词语言 叙词语言最主要的特征:规范化+概念组配 国内外常用的叙词表主要有: 英国《科学文摘》使用的《INSPEC叙词表》 美国《工程索引》使用的《COMPENDEX叙词表》 中国的《汉语主题词表》;(2)关键词语言 关键词语言的主要特征 直接采用描述文献主题概念的词语,不加规范化处理。 标引简单,检???途径多,查准率较高。 漏检可能性较大,族性检索功能较差 不显示词间等级关系和相关关系,增加了检全文献的难度。;(3) 标题词语言 优点 缺点 常用的标题词表有《美国国会标题词表》(LCSH) (4) 单元词语言(元词) 优点 缺点;第二节 文献信息检索的途径、方法和技术;二、文献检索方法 1.直查法 2.常用法(工具法、普通法) 包括顺查法,倒查法和抽查法 3.追溯法(扩展法、追踪法) 4.综合法(分段法、循环法、交替法) ; 三、文献信息检索技术 布尔逻辑检索技术 截词检索技术 位置检索技术 限制检索技术 全文检索技术 加权检索技术 多媒体检索技术 ; 1.布尔检索(Boolean Search) 逻辑与“AND”(常用符号*表示) 逻辑或“OR”(常用符号+表示) 逻辑非“NOT”(常用符号“-”表示) ;1.1 逻辑与 “A AND B”或写成“A * B” 被检索的文献记录中同时含有A和B两个概念。 ; 1.2? 逻辑或 “A OR B”或写成“A + B” 被检索的文献记录中含有A或含有B,以及两词概念都包含。 ? ; 1.3??逻辑非 “A NOT B”或写成“A - B” 被检索的文献记录中含有A而不含有B概念。 ;2.截词检索技术 截词检索按截断的位置划分,有后截断、前截断、中截断; 按截断的字符数量来分,有有限截断和无限截断。 常用“?”、“*”等来表示. ? ;2.1? 后截断 如: legislat? —legislate , legislation , legislator , legislative 立法, 法规, 立法者,立法机关 ; 2.2 前截断 如:“?英语考试” ——四级英语考试、六级英语考试、研究生英语考试 ; 2.3 中截断

文档评论(0)

22255990 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档