信息组织知识点汇总.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识点汇总 第一章 1、信息组织的定义 以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。 2、信息组织的原理 基本原理: 如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。 信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。 3、信息组织的内容 一般而言,信息组织包括四项内容。 1.信息筛选(甄别有用信息,剔除无用信息) 2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类) 3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程) 4.信息整序与存储(按照一定的格式和顺序存储在特定的载体中) 4、信息组织的类型 按信息的认识层次划分,信息组织有三种类型 1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法) 2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法) 3.语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法) 5信息组织的作用 控制整序 提升品质 传播利用 节约成本 第二章 熵(entropy) 最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度。信息量越大,体系结构越规则,功能越完善,熵就越小。利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。学术界目前普遍接受的观点是“信息即负熵”。 2、逻辑学原理在信息组织中的应用 概念之间的关系(图略): 相容关系 同一关系:是指有相同外延的两个概念之间的关系。 包含关系(属种关系):是指这样两个概念,其中一个概念完全被包含在另一个概念的外延里,是另一个概念外延的一部分。包含另一个概念的概念(外延广的概念)对被它包含的概念(外延窄的概念)来说是上位概念或属概念,被包含的概念对包含它的概念来说是下位概念或种概念。 交叉关系:是指有一部分外延重合的两个概念之间的关系。 不相容关系 并列关系:是指同一个上位概念(属概念)之下的几个不存在共有外延的下位概念(种概念)之间的关系。 矛盾关系:这是概念并列关系的一种特殊形式,是指外延总和等于其上位概念全部外延的两个并列概念之间的关系,非此即彼,没有第三种情况。 对立关系(反对关系):也是概念并列关系的一种特殊形式,是指外延总和小于其上位概念全部外延的两个并列而且是相互对立的概念之间的关系。 第三章 1、规范语言 定义:规范语言从自然语言出发,根据信息描述与信息检索的需要,从自然语言中筛选出特 定的词汇来网罗和指示概念,并依据一定的规则对自然语言进行事先规范而形成的人工语言,是符号化的概念表示系统。规范语言也称为受控语言、人工语言。 规范语言是人工控制的语言系统,词汇控制和句法控制是核心所在。 规范语言的词汇控制 (1)词汇的选择:精选、压缩,保留具有检索意义的词汇,尽可能地控制词汇规模。 (2)词形的控制:实现词义和词形的唯一性。 (3)词义的控制:采用加限定词或加注释的方法让词汇与概念一一对应。 (4)词间关系的控制:采用索引、图示系统或参照系统来揭示词典中语词间关系。 规范语言的句法控制 (1)引用次序/组配次序:显著性引用次序、范畴职能引用次序、上下文从属引用次序 (2)控制符号:联号、职号、关系符号、加权 例: 537+621.3 (3)句式变换:检索词轮排转化。(机检时代已经变得无足轻重) 规范语言的类型: 按照结构原理分 分类语言:等级体系式、分面组配式、等级-组配式 主题语言:标题法、单元词法、叙词法 代码语言:化合物分子式、档案号、专利号 按其标识的组合使用法分 先组式语言:语词标识在编表时就固定组配好 后组式语言:检索时进行临时组配 自然语言(关键词、自由词和出现在文章题名、摘要、正文和参考文献中的具有实质意义的语词) 自然语言的复兴——“以用户为中心” 自然语言的应用:自然语言处理、自然语言标引、自然语言检索。 自然语言的不足: (1)概念与语词不是一一对应的关系。 (2)概念之间的关系具有隐含性,缺乏对词间关系的揭示与描述。 (3)检索效率直接与用户的认知水平相关。 后控制词表——弥补自然语言的不足 “后控制模式”=“标引不控

文档评论(0)

woai118doc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档