网站大量收购闲置独家精品文档,联系QQ:2885784924

信息化导论第八讲信息资源及其利用.ppt

信息化导论第八讲信息资源及其利用.ppt

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息化导论第八讲信息资源及其利用

8.1 信息源及其分类 门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 · 免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。 (4)元数据在地理界,生命科学界等顶域也有其相应的定义和应用。 2. 元数据的基本特点 (1)元数据一经建立,便可共享。元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要; (2)元数据首先是一种编码体系。元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。 (3)由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。 1. 文件 用文件进行数据管理有两个主要特征: (1)每个文件都有一个可以识别的名字——文件名,并且可以用这个名字对文件中的信息进行访问。 (2)文件中的信息被保存在外部存储器中。外部存储器中的信息是无源信息——所保存的信息不因断电而丢失(而内存的信息会因断电而丢失)。 最基本的文件分类: (1)程序文件——用于存储一个或一部分程序。 (2)数据文件——只存储要处理的数据。当然,数据文件还可以进一步分为多种类型,如文本文件、图形文件等。 文件系统也有很大局限性,例如: (1)数据的冗余度(redundancy)太大。不同的业务,往往会对不同的数据集合进行处理,这些数据集合中也往往会有重复。例如,关于工资的数据文件与关于人事的数据文件会有大量数据重复。 (2)数据和应用程序过分相互依赖。文件系统的设计基本上还是以程序为中心 文件系统 程序1 程序2 程序n 数据集1 数据集n 数据集2 ┇ ┇ (3)数据的一致性差。由于数据会重复存储,各自管理,一处对于数据的更新,其他处不一定作同样更新,造成数据的不一致。 2. 数据库的特征 (1)从以程序为中心转向以数据为中心,数据可以为不同的应用共享。 (2)数据模型化。为了有效地组织数据库中的数据集,要为它们建立合适的数据模型,以反映数据之间的关系。已经使用过的数据模型有层次模型、网状模型和关系模型。目前绝大多数DBMS采用关系模型。关系模型就是用二维表组织数据并描述数据之间的联系。 程序1 程序2 程序n 数据库1 DBMS ┇ (3)数据独立性增强。由于DBMS的作用,数据库中的数据可以从用户、数据库管理员和系统程序员三个不同级别的模式,分别称为外模式、模式和内模式。三级模式之间通过两级映射,使外模式独立于模式,模式独立于内模式。这样数据与应用程序之间的独立性大大增强。简单地说,可以称为三级模式两级独立性。 3. SQL语言 SQL(structured query language)是一种应用于关系数据库的形式化语言。它能够完成关系数据库的数据定义、数据查询、数据操纵和数据控制。这些功能使用表8.5所示的9个SQL核心动词就可以完成。 SQL功能 所使用动词 含 义 数据定义 CREATE DROP ALTER 从一个表或多个表中检索列和行 创建一个新表 删除一个表 数据查询 SELECT 在一个已经建立的表中修改字段设计 数据操纵 INSERT UPDATE DELETE 向一个表增加行 更新表中已经存在行的某几列值 从一个表中删除行 数据控制 GRANT REVOKE 用户授权 权限收回 1. 数据仓库及其特点 信息资源的增加是决策一把双刃剑,既可以为决策提供更多的依据,但在某些地方反而不利于决策,造成了现代商业“数据过量,信息不足”的现象。数据挖掘技术提供了可以从大量的数据中挖掘出数据模式——知识的一种形式。但是,有效的数据挖掘结果应当有好的数据环境。 (1)数据挖掘要求有大量的数据的支持。有了大量的数据,数据挖掘才能较好地发挥作用,而且要求数据具体、干净、一致。很难想象,能够从不干净的数据中挖掘出可用、有效的信息来。 (2)能面向主题提供数据。主题是在较高的层次上将信息系统中的数据进行综合、归类以及分析、利用的抽象。决策都是基于主题的,决策分析是面向主题的,或者说,主题是决策分析的对象。然而,在数据库中,数据分为三级模式:内模式(存储模式)、模式(逻辑模式)和子模式(外模式或用户模式)。子模式是基于应用处理的;模式是对各子模式的综合,是基于数据的组织的;内模式是基于存储的。 (3)能提供集成的数据环境。一方面,分析用的数据来自数据库,是从数据库中抽取出来的

您可能关注的文档

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档