第二章信息检索基础知识.pptVIP

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 信息检索基础知识 重点理解“信息检索”和“文献检索”涵义与区别 掌握几种常用的检索语言 了解文献检索的方法、途径及步骤 1.根据检索对象的不同可分为 数据检索 事实检索 文献检索 工具书的类型 可按用途分为两大类?? 1. 指示线索型检索工具(二次文献)---检索工具书:(1)书目、馆藏目录(包括联合目录);(2)索引:包括报刊、文集、代号、人名、机构、地名索引;(3)文摘; 2.提供具体信息的工具书(三次文献)---参考工具书:(1)词典;(2)百科全书;(3)传记资料;(4)手册;(5)机构名录;(6)地理资料;(7)统计资料;(8)年鉴;(9)政府文献等 工具书正文的排序方式主要有 (1)字顺法:按条目、词目或主题词的字顺序的方法。 音顺:按汉语拼音的音序排检 号码:常用的有四角号码。 形序:包括笔划、笔形。 参考工具书中的字典、词典、百科全书的正文通常都按此法排列;检索工具书的著者索引、主题索引也按此法排列 (2)分类法:按类目名称或按分类号排序。 (3)时序法:也称编年法。 按条目涉及事件 发生的时间先后顺序编排的方法。例如:历法、年表、年谱一般都采用这种排检方法。统计资料、年鉴有不少也是按这种方法排序。 (4)地序法:也称地域法 是指按条目所发生的地理位置编排的地方。各种地图都是按这种方法编排的。地名录、机构名录有许多也都是按地序法编排的。 (5)混合编排法:有些名录和年鉴采用两种以上的编排方法 检索语言是根据文献存贮与检索的需要,在自然语言的基础上规范化了的一种人工语言。 ——它贯穿于文献存贮和检索的全过程,是沟通标引人员和检索人员之间思想的约定语言。 分类语言 分类语言是运用概念划分的方法,按文献内容所属学科、专业性质的逻辑次序,以数字、字母或数字与字母结合为基本字符,以分类号为标识,用来存储和检索文献的文献标识系统。 分类语言的特点 主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个有条理的体系 提供从学科分类查找图书的途径 典型分类法 中国图书馆图书分类法(中图法) 中国科学院图书馆图书分类法(科图法 ) 国际十进制图书分类法(UDC,在国际上交流的文献必须用它 ) 杜威十进分类法 美国国会图书馆分类法 中国图书馆图书分类法—中图法 五大部类序列为如图: 中图法简表 分类号由字母和数字组成 采用等级列举表达从属关系 分类号越长,表示的学科范围越窄。为了醒目, 通常在分类号的第三位数字后,隔以?,如F279.712,TQ032.4 中图法 T 工业技术……… 一级类目 TU 建筑科学 ………二级类目 TU1 建筑基础科学…………. 三级类目 TU4 土力学、地基基础工程… 三级类目 TU41 土工实验 …………… …四级类目 TU411 实验室实验…………… 五级类目 .1 化学性质实验….六级类目 …… 索书号 反映了图书的具体排列次序和存放位置 组成:分类号+书次号 分类号:按学科分类图书 书次号:区分同类图书,有两种取法: 种次号:按图书到馆的先后顺序给予号码。缺点:会使同一著者的同一类著作排放在不同位置 著者号:按著者名称(代码)来区分同一分类号下的不同文献 图书的排架顺序 按索书号排架 先顺序分类号,对位排列 再顺序书次号 种次号:由数字构成,按数字大小顺序 著者号:由字母和数字构成,对位排列 主题语言 主题语言是指以自然语言的字符为字符,以名词性术语为基本词汇,用名词性术语作为标识的一种信息标识系统。是主题概念检索文献信息的检索语言。 ????它有有两大特点: 一,直接用能表达、描述文献内容特征的名词性术语作为标识来揭示文献的内容特征; 二,把这些标识按字顺排列成主题词表,以此作为标引、检索文献的工具 主题法与分类法的比较 关键词语言的缺点 同义词标引--引起漏检 检索体系是按主题词字顺排列的,而用于标引的关键词呈现出多种字面形式-同义词时,将使同一主题的文献分散到不同的字顺位置,使查全率受到影响。 例:飞机? Airplane Aircraft Planes 多义词标引--引起误检 多义词 cell ? 电池 ? 细胞 检索词 cell 查找细胞方面的文献 结果:电池、细胞两方面的文献同时被检出 主题词表-单元词表 单元词法--用单元词的组配来表示文献主题 -此法的出发点是概念组配,即认为各种完整

文档评论(0)

celkhn5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档