信息学概论05.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息学概论 成都信息工程学院 黄 波 2009年2月 信 息 整 序 信息整序,又称信息组织,是采用各种方法和手段使信息有序化的过程。它通过揭示信息之间内在的逻辑联系,将某一方面大量、分散和杂乱的信息经过加工、整理、提炼.使之组织化、系统化,从而达到有效利用的目的。 在这个过程中,混乱无序的原始信息变成一个有序和便于利用的信息系统。 信 息 整 序 基 本 原 理 信息的自然有序化。 自然有序化伴随着信息传递与利用者的思维过程,表现为人们对信息的自然选择、排序、评价、吸收等过程。 信 息 整 序 基 本 原 理 信息的加工有序化构。 现代信息工作的意义在于:在宏观上和总体上处理大量的信息,改变它们的结构和存在形式,使其具有一种人为的科学的合理的结构。在这个结构中,个别的用户,能根据自己特定的信息需求,凭借由信息机构组织而成的信息结构所提供的检索手段,获取自己所需的信息。这一意义同时构成了信息整序的意义。 信 息 整 序 基 本 原 理 信息整序的基本原理是:设有若干信息,如果将这些信息按照其某种特征值(关键码)排列成一个序列,而且需要使用信息的用户能将自己的信息需要转换成相应的特征值,并在排列后的信息序列中找到自己所需要的特定信息,则称这些信息是有序的。按照某种特征值(关键码)排列信息的工作称为信息整序。 信 息 整 序 基 本 原 理 信息整序方法及检索工具按结构特点可分为四种基本情况: 1.线性结构或线性整序法。 2.树型结构或树型整序法。其最根本特点是每个信息单元只能有一个前信息单元而又可以有多个后信息单元。 按树型结构排序的检索工具或信息集合的最大优点是检索迅速。它们的检索功能来自能使检索者逐步缩小检索范围。以多级分类表(即体系分类表)为例,检索时先查大类,大类中再查小类,小类中再查更小的类,如此逐步缩小范围,直至找到所求的信息单元。 信 息 整 序 基 本 原 理 3.网型结构或网型整序法。 按这种结构整序的检素工具有主题词表、叙词去,带有“参见”、“见”关系的各种目录和索引。数据库的网络模型也是网型结构。网型结构较为复杂,但是它的查准率和查个率均较高。 4.多维结构或多维的信息整序法。 信 息 整 序 基 本 原 理 复合结构。 上述四种结构为信息整序和检索工具的最基本的内部结构。任何复杂的信息整序或实际的检索工具都可以由这四种基本结构复合而成。 信 息 整 序 的 内 容 信息整序的内容包括:信息搜集与选择、信息描述与揭示、信息加工与整理、信息分析与存储。 著录,主要描述文献信息的形式特征; 标引,主要揭示文献信息的内容特征。 文献标引包括分类标引和主题标引。如《中国图书馆分类法》、《汉语主题词表》等都是相应的标引语言的词典。 信 息 整 序 的 内 容 随着信息网络的迅速发展,信息资源的主流形式,正逐步从图书、期刊等印刷型文献过渡到网络化、多媒体化和分布式的数字化信息资源或数字文献,信息资源的描述也随之发生着改变。 信 息 整 序 的 内 容 在数字化信息资源的描述与组织中,MARC发展得最早,但它格式复杂,只适宜专业人员操作。 MARC即机器可读目录(Machinc Readable Catalogue)的英文缩写,简称机读目录。 信 息 整 序 的 内 容 元数据(metadata)采用较为简单的方式,揭示和描述数字化文献。 所谓元数据,就是描述数据的数据(data that describes data)。 信 息 整 序 的 内 容 目前,最受关注且应用比较广泛的是都柏林核心集(Dublin core) 。 都柏林核心集是网络环境中,帮助发现文件类对象所需要的最小元数据元素集。 相比复杂的MARC格式,都柏林核心集较为简单,可以简化著录项目。 信 息 整 序 的 内 容 都柏林核心元数据集由15个基本元素组成:主题词(Subject)、题名(Title)、作者或创造者(Creator)、出版者(Publisher)、内容描述(Dcscription)、其他责任者(Contributor)、出版日期(Date)、类型(Type)、格式(Format)、标识(Identifier)、关联(Rclation)、来源(Source)、语种(language)、覆盖范围(Covcrage)和权限管理(Rithts)。 信 息 整 序 的 内 容 数字化信息资源的揭示方法有: 自动标引技术。 数据挖掘技术。 信息推送技术。 基于内容的信息检索。 信 息 整 序 的 内 容 数据库中记录的组织: 字段是记录的基本单元,它是对实体的具体属性进行描述的结果。一条记录由若干个字段组成。 记录是对某一实体的全部属性进行描述的结果。在全文数据库中一条记录相当于一篇完整的文献;在书目数据库中,一条记录相当于一条文摘或题录。 信

您可能关注的文档

文档评论(0)

iris + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档