- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8.1 信息源及其分类 门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 · 免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。 (4)元数据在地理界,生命科学界等顶域也有其相应的定义和应用。 2. 元数据的基本特点 (1)元数据一经建立,便可共享。元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要; (2)元数据首先是一种编码体系。元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。 (3)由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。 1. 文件 用文件进行数据管理有两个主要特征: (1)每个文件都有一个可以识别的名字——文件名,并且可以用这个名字对文件中的信息进行访问。 (2)文件中的信息被保存在外部存储器中。外部存储器中的信息是无源信息——所保存的信息不因断电而丢失(而内存的信息会因断电而丢失)。 最基本的文件分类: (1)程序文件——用于存储一个或一部分程序。 (2)数据文件——只存储要处理的数据。当然,数据文件还可以进一步分为多种类型,如文本文件、图形文件等。 文件系统也有很大局限性,例如: (1)数据的冗余度(redundancy)太大。不同的业务,往往会对不同的数据集合进行处理,这些数据集合中也往往会有重复。例如,关于工资的数据文件与关于人事的数据文件会有大量数据重复。 (2)数据和应用程序过分相互依赖。文件系统的设计基本上还是以程序为中心 文件系统 程序1 程序2 程序n 数据集1 数据集n 数据集2 ┇ ┇ (3)数据的一致性差。由于数据会重复存储,各自管理,一处对于数据的更新,其他处不一定作同样更新,造成数据的不一致。 2. 数据库的特征 (1)从以程序为中心转向以数据为中心,数据可以为不同的应用共享。 (2)数据模型化。为了有效地组织数据库中的数据集,要为它们建立合适的数据模型,以反映数据之间的关系。已经使用过的数据模型有层次模型、网状模型和关系模型。目前绝大多数DBMS采用关系模型。关系模型就是用二维表组织数据并描述数据之间的联系。 程序1 程序2 程序n 数据库1 DBMS ┇ (3)数据独立性增强。由于DBMS的作用,数据库中的数据可以从用户、数据库管理员和系统程序员三个不同级别的模式,分别称为外模式、模式和内模式。三级模式之间通过两级映射,使外模式独立于模式,模式独立于内模式。这样数据与应用程序之间的独立性大大增强。简单地说,可以称为三级模式两级独立性。 3. SQL语言 SQL(structured query language)是一种应用于关系数据库的形式化语言。它能够完成关系数据库的数据定义、数据查询、数据操纵和数据控制。这些功能使用表8.5所示的9个SQL核心动词就可以完成。 SQL功能 所使用动词 含 义 数据定义 CREATE DROP ALTER 从一个表或多个表中检索列和行 创建一个新表 删除一个表 数据查询 SELECT 在一个已经建立的表中修改字段设计 数据操纵 INSERT UPDATE DELETE 向一个表增加行 更新表中已经存在行的某几列值 从一个表中删除行 数据控制 GRANT REVOKE 用户授权 权限收回 1. 数据仓库及其特点 信息资源的增加是决策一把双刃剑,既可以为决策提供更多的依据,但在某些地方反而不利于决策,造成了现代商业“数据过量,信息不足”的现象。数据挖掘技术提供了可以从大量的数据中挖掘出数据模式——知识的一种形式。但是,有效的数据挖掘结果应当有好的数据环境。 (1)数据挖掘要求有大量的数据的支持。有了大量的数据,数据挖掘才能较好地发挥作用,而且要求数据具体、干净、一致。很难想象,能够从不干净的数据中挖掘出可用、有效的信息来。 (2)能面向主题提供数据。主题是在较高的层次上将信息系统中的数据进行综合、归类以及分析、利用的抽象。决策都是基于主题的,决策分析是面向主题的,或者说,主题是决策分析的对象。然而,在数据库中,数据分为三级模式:内模式(存储模式)、模式(逻辑模式)和子模式(外模式或用户模式)。子模式是基于应用处理的;模式是对各子模式的综合,是基于数据的组织的;内模式是基于存储的。 (3)能提供集成的数据环境。一方面,分析用的数据来自数据库,是从数据库中抽取出来的
您可能关注的文档
- 信号检测与处理[精选].ppt
- 信号设备基础面硬化标准图[精选].doc
- 信号设备防雷[精选].ppt
- 信念+勤奋+坚持[精选].ppt
- 信息与信息技术课件(ppt)[精选].ppt
- 信息与激励[精选].ppt
- 信息传递方式的变化[精选].ppt
- 信息化、数字化、全球化与新闻传播[精选].doc
- 信息化下的医院统计数据质量控制(郭萍)[精选].ppt
- 信息化促进中国改革[精选].doc
- 急性脑梗死部位及面积与吞咽障碍的相关性研究:基于临床特征与机制分析.docx
- 政府投入视角下医院公益性伦理的深度剖析——以高州医院为范例.docx
- 臭氧水漱口:血液肿瘤患者口腔黏膜炎治疗的新探索.docx
- 大豆胞囊线虫生防菌的探索与应用:机制、筛选及前景.docx
- ABL-N对L1210细胞增殖和凋亡的影响及作用机制探究.docx
- 同种异体脐带间充质干细胞构建人工椎板:从实验到临床的探索.docx
- 论教唆、帮助自杀行为的刑法学审视:法理辨析与实践考量.docx
- 论滥诉抑制义务论:法理基础、实践困境与制度构建.docx
- 揭秘七彩神仙鱼成色密码:类胡萝卜素增色效应的深度探索.docx
- 基于数据挖掘的推荐技术研究.docx
最近下载
- 《2013年建设工程工程量清单计价规范》GB50500-2013.pdf VIP
- 2025年南京市教师招聘考试公共知识试题卷(含历年真题赠送).docx
- 生物命题培训课件.pptx VIP
- Schneider施耐德安装和操作手册-ATV930 ATV950 御程系列变频器安装手册.pdf
- 2025年国考《行测》真题及完整答案详解【夺冠系列】.docx
- J-BT 10466-2020星形弹性联轴器.PDF VIP
- 数据容灾备份中心建设方案书.docx VIP
- 卫生服务中心“十五五”五年中长期发展规划(2025-2029年).pptx
- 第十一章 地层与地层单位.ppt VIP
- 石膏板生产线联合车间车间施工组织设计.doc VIP
原创力文档


文档评论(0)