信息组织期末复习资料.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息组织期末复习资料信息组织期末复习资料

信息检索需求的多样化 (1)文献检索:是以文献为检索对象的信息检索。它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。文献检索的结果是提供与课题相关的数篇文献的线索或原文,供用户参考.(2)数据检索:是以数值和图表形式表示的数据为检索对象的信息检索。数据检索是一种确定性检索.(3)事实检索:是以从文献中抽取的事项为检索内容的信息检索。 信息标引:就是对信息内容进行分析并充分而有效地予以揭示。揭示信息的内容是检索信息、利用信息的前提条件。从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。准确标引信息要求准确的内容分析,否则就会出现错误标引。 信息系统组织:信息通过特征描述和内容揭示,获得了表示信息的标识,但这只是针对某一文献和信息单元的,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。信息系统组织是把描述和标引的信息实体和信息记录组织成一个有序的系统。 一、信息组织方法:(一)按组织对象分:文献实体组织与信息内容组织(二)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织(三)常用信息组织方法:1.分类组织法 2.主题组织法 3.集成组织法 三、信息组织手段 1、人工组织 2、自动组织 1、分类检索语言:分类检索语言习惯简称分类语言或分类法,分类检索语言语族主要有三个语支, 即(1)等级体系分类语言 (2)分析综合分类语言 (3)半分析综合分类语言。 2、主题检索语言 (1)标引词语言(2)单元词语言 (3)叙词语言 检索语言词汇控制的意义:检索语言构成材料就是词汇,把词汇按某种方式组织起来构成检索语言词典,它是标引和检索的工具。检索语言的词汇控制又称规范化处理。由于表述信息内容的词汇非常庞杂,日常的自然语言词汇并非都能准确表达信息的学科和主题内容。 自然语言缺点(1)词汇的同义现象。(2)词汇的多义现象。(3)词汇语义不清或语义不确定。(4)词量庞大(5)词间关系不明晰 在现行的一些检索系统中,也比较广泛地直接采用自然语言检索,它虽然节省了词汇控制的成本,但却是以牺牲检索效率为代价的。因此,完全采用自然语言进行信息组织的系统并不是理想的检索系统。即便是面对互联网急剧增长的信息资源,人们也越来越感到需要进行规范化控制。由此有了规范化检索语言在网络信息组织中的应用研究,有了网络本体语言的开发。网络信息组织从自由走向规范足以说明词汇控制的意义。 检索语言词汇控制的内容:词汇控制的目的是为了使检索词符合唯一性、规律性、定型性、通用性和准确性。为了达到这个目标,应该从以下几方面进行词汇控制。 (1)词量控制。词量控制是指对收入词表的词汇进行压缩、精选,使之与所要标引的信息数量和检索要求相适应。(2)词类控制。自然语言词汇有多种类别,如名词、动词、形容词、副词、介词、叹词,还有大量的词组。(3)词形控制。词汇也存在不同的书面表达方式,如不同的次序、简繁体、单复数、不同拼写法,以及标点符号、字符、数字等,为了实现每个词词义和词性的唯一性,必须进行词形控制。(4)词义控制。检索语言中的每个词汇都只表示一个概念,即使检索语言词汇一般都比较精炼和简短,也会出现一词多义和同形异义现象。因此,必要时在主题词或类目词后加限定词,加含义及范围注释,或附加简明定义等。(5)词间关系控制。在情报检索语言词典编制中,对词汇语义和词间关系必须控制,这是为了词典中每个词汇都有独立的语义,词间关系能形成一个语义网。(6)专指度控制。检索语言词汇的专指度是指其语义的内涵与外延与信息主题内容的切合程度。 信息检索系统由六个子系统构成:(1)信息选择子系统 (2)标引子系统 (3)词表子系统 (4)检索子系统 (5)用户与系统之间的交互子系统 (6)匹配子系统 即对信息标引与提问标引进行匹配的子系统。从系统构成分析可见,检索语言和标引是系统的中心环节,它起着承上启下,连接用户与系统的关键作用。 概念之间的关系(一)属种关系:它是指一个概念的外延包含另一概念的全部外延,其中,外延大的概念叫属概念,外延小的概念叫种概念。(二)同一关系:它是指两概念在外延上完全重合。(三)交叉关系:即两种概念之间有且只有一部分外延是重合的。 概念逻辑方法 概念的限定与概括 概念的限定是指通过增加概念的内涵以缩小概念的外延,即由属概念过渡到种概念的逻辑方法。对一概念进行限定,从语言上说一般是增加限制词,如定语、状语等,例如,给“人”加上“大”就成为“大人”,增加的限制词应是恰当的,不能与原概念矛盾或重复。 概念的概括是与概念的限定相反的一种逻辑方法,它是通过减少概念的内涵从而扩大其外延,由外延较小的种概念过渡到

文档评论(0)

yyanrlund + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档