第二章信息检索基础.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一方面是用户的信息需求, 一方面是组织有序的文献信息集合,检索就是从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出相关的信息。   匹配有其匹配标准,这里涉及到两者一致性、相关度等问题,按一定的标准筛选出符合要求的信息。 每件文献均有内部的(信息内容)特征及其相关的外部特征。从文献的特征出发,将其特征值与检索系统中标目数据进行计算比较,通过匹配达到检索目的。   文献信息特征是多方面的,用于文献检索的检索点很多,   反映文献信息内容特征的有:分类检索和主题检索;   反映文献外部特征的有:作者检索、名称检索和号码检索等。 中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法 广泛用于图书资料的是图书分类法。图书分类法的作用是指示用户根据学科内容检索图书资料,指导用户从开架书库(open shelf)中按类号顺序找到指定的图书及其内容相关的资料。许多出版物上都有图书在版编目CIP(Cataloging In Print)。在我国出版的图书、专著上图书在版编数据中有中图法分类号一项。 中国图书馆图书分类法 社会科学   A 马列主义 B 哲学 C 社会科学总论 D 政治,法律 E 军事 F 经济 G 文化,科学,教育,体育 H 语言 I 文学 J 艺术 K 历史,地理   自然科学 N 自然科学总论 O 数理科学和化学  P 天文学,地球科学 Q 生物科学 R 医药,卫生 S 农业科学 T 工业技术 U 交通运输 V 航空,航天 X 环境科学 Z 综合性图书 T: 工业技术 TB 一般工业技术 TD 矿 业工程 TE 石油 TF 冶金 TG 金属学,金属工艺 TH 机械,仪表工业 TJ 武器工业 TK 动力工程 TL原子能技术 TM 电工技术 TN无线电电子技术,电讯技术 TP自动化技术,计算技术 TQ化学工程 TS轻工业,手工业 TU建筑科学 TV水利工程 2. 主题词语言    主题(subject)检索是从反映文献内容的有关主题词出发来检索文献,主题是检索点,它对应文献主题概念。检索按主题词的音或形的字顺进行,其方式如查字典、词典。主题词的合理选择与使用对检索结果的优劣直接相关。 标题词语言:是传统的主题检索语言,是以文献的标题词作为标引和检索文献的方法。所谓标题词,是指从自然语言中选取,经过词汇控制的比较定型的事物名称和名词术语。 关键词语言:是以文献中的关键词作为标引和检索文献的方法。所谓关键词是指从文献题名或者文摘以及正文中抽取的,能够表达文献主题并具有实质意义的未经规范化处理的自然语言词汇。 叙词语言:是以叙词作为标引和检索文献的方法。所谓叙词是指从文献题目、正文、摘要中抽取出来的,用以表达文献内容的自然语言并在这些自然语言是优选出来的经过规范化处理的名词术语。 3.作者检索    作者(author)检索是从文献的作者姓名出发来检索其文献。 作者广义上还应包括:汇编者(compiler)、编者(editor)、主办者(sponsoring body)、译者(translator)等,此外,还有代表机构、单位的团体作者(corporate author),包括作者所在单位(authors affiliation)。   检索按作者姓名或机构名称字顺进行。如果查个人,对于西方作者通常也是按姓氏(family name)查找,表达方式可将姓氏放在前,而名字(given name)在后,形成倒叙形式,这时姓名中间往往插入一个逗号,如:Peter, P. R. ,首先检索姓氏Peter。 4.名称检索   名称(title)检索点是从各种事物的名称出发来检索文献信息。 这些名称包括:书名、刊名、资料名、出版物名、出版社名、会议名、物质名称等等,也包括人名和机构名。检索的对象既包括对应的文献,也包括有关的信息、事项等。比如个人电话簿(white pages)或公司电话簿(yellow pages),查找的是号码信息。 5. 号码检索   号码包括文献的编号(number)、代码(code)等,它们是文献信息的一些特有的外部标识,号码检索点以号码特征来检索文献信息。号码多种多样,通常用数字、字母或用它们结合的形式或以分段的方式来表示其各部分的含义。比如科技报告有报告号,还有其合同号、拨款号等,比如专利文献有专利号、入藏号、公司代码等;比如分类号也是号码,等等。它们各自按号码顺序,或以数序、或以字序、或以混合序列检索。分类检索可看作一种特殊的号码检索,分类号是它的检索点。 在对图书和期刊检索时常用到两个号码:国际标准书号ISBN(Internati

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档