第6章商务智能基础数据库与信息管理.pptVIP

第6章商务智能基础数据库与信息管理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章商务智能基础数据库与信息管理

第六章 商务智能基础:数据库与信息管理 开篇案例:惠普能否从企业数据仓库中挖掘成功 HP的CIO:Randy Mott (兰迪 莫特) 惠普有大量的数据,存放在多个应用程序和数据库中,分布于全球各地的不同部门和不同领域。然而,众多的系统和应用程序却无法提供所需要的完整且前后一致的信息。 惠普的CIO决定: 建立数据仓库,即在全公司建立一个可共享的信息库,用于提供统一而且准确的商业信息。该数据仓库取代了17种不同的数据库技术,通过连接目前正在使用的1.4万个数据库,使不同地区和部门的员工都可以在第一时间获取所需数据。 HP最终将这一数据仓库系统发展为独立产品:Neoview,并销售给其他企业 6.1 传统文件环境下的数据整理 6.1.1 文件组织术语和概念 字段 记录 某个数据库中的一份表文件,该文件存储了选修《管理信息系统》课程的10级物流专业的同学名单。每列是一个字段,每行为一个记录。 从数据库原理的角度来看,表中反映了“学生”这一类实体集(Entity Set),表中的每一行是该类型中的一个具体的实体,每个实体都具有学号、姓名、专业名称等属性 6.1.2 传统文件环境的问题 数据冗余与混乱 程序--数据依赖 欠缺弹性 安全性低 缺乏数据共享 与实用性 同样的这样一张表,如果在学校的学生处、教务处分别存储一份,可能会立即产生各种问题。 6.2 使用数据库管理数据 6.2.1 数据库管理系统 有了DBMS,用户和程序员不需要直接和数据库打交道,只需要通过各种应用程序去调用数据库即可。这极大地简化了工作量。 例如:在网上发布一条微博,用户完全不必关心这条微博存储在哪台网站服务器上的哪个存储区域,以何种格式存储……这一切均由DBMS完成。 1、DBMS如何解决传统文件环境带来的问题 2、关系型数据库管理系统 层次型DBMS 网型 DBMS 关系型DBMS,它是严格的、标准的二维表格 关键字(Primary Key) 外关键字(Foreign Key) 3、关系型DBMS操作 4、面向对象数据库管理系统 选择 投影 联接 6.2.2 DBMS的优势 Visual Foxpro中的数据定义 Access中的数据定义 SQL Server中的数据定义 SQL语言是几乎所有关系型数据库的通用语言,要深入掌握SQL语言并不容易,为此,许多DBMS允许用户以可视化方式创建查询,然后为用户自动生成对应的SQL语言并执行。如图是在Access中完成一次交叉表查询,生成的SQL语句从功能上看属于数据操纵语言。 例如,有某个关系如下 学生(学号、姓名、性别、年龄、籍贯、入学分) 在该关系中,不同记录之间,只有学号是不能重复的,而其他的都存在出现重复项的可能,因此学号就是该关系的关键字。 又如学生的选课关系: 学号 课程号 成绩 1001 A1 89 1002 A1 78 1001 A2 89 1002 A2 78 学号、课程号、成绩三项都有可能重复,因此其中的单独某项不能作为关键字,只能取属性的集合作为关键字。 经过简单分析可以得出,只有学号+课程号的组合不可能出现重复项,即该关系的关键字是(学号、课程号) 6.2.3 设计数据库 规范化和实体联系图 编号 姓名 电话 市话 手机 在Word和Excel中均允许制作如上的表头,但在数据库中是不允许的 关系数据库规定:每个属性是不可再分的。若违反这一规定,则称其为不满足第一范式(1NF)。 达到第一范式是关系数据库的最基本要求。 再看右表: 学号 姓名 籍贯 课程号 成绩 1001 张三 合肥 A1 87 1002 李四 芜湖 A1 92 1001 张三 合肥 A2 85 1002 李四 芜湖 A2 76 显然该关系满足第一范式 如前所述,该关系的关键字是(学号、课程号) 但是:学生的姓名和籍贯被重复存储了,这是不必要的,究其原因在于:学号本身就可以直接决定姓名和籍贯,无须借助于课程号来实现。这就迫使我们要对该关系做出分解,即: 关系1:学生(学号、姓名、籍贯) 关系2:选课(学号、课程号、成绩) 分解后可知:上述情况消失了。(虽然学号仍被重复存储了,但这是为了更好地使用数据库而做出的一种妥协) 如果某个关系存在这种情况: 关系的关键字是属性的组合,但是其中某个属性又可以独立地决定其他属性,则称该关系不满足于第二范式。 换言之:若某关系的关键字是单个属性,则该关系必然满足第二范式。 学号 姓名 系别 系主任 1001 赵大 英语 老张 1002 钱二 英语 老张 1003 孙三 贸易 老李 1004 李四 贸易 老李 经分析可知:左表中的关键字是学号,由于是单属性,因此其必然满足第二范式。 但是:“系主任”仍然出现了重复存储的现象。 此外,若英语系的学生全部毕业,数据删除,同时也就抹去了“

文档评论(0)

gangshou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档