- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库课堂教学与上机实践 第七章 数据管理 ② 投影:从指定关系的属性集合中选取若干个属性组成新的关系。如从关系成绩中选择“学号”、“姓名”、“英语”组成新的关系S2 。如下图所示。 ③ 联接:将两个关系中的元组按指定条件组合,生成新的关系。如将成绩1和成绩2按相同学号合并组成新的关系S3,如下图所示。 传统的数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。 相对稳定 数据仓库中的数据时间期限要远远长于普通数据库中的数据时间期限。普通数据库中的数据时间期限一般是60到90天,而数据仓库中的数据时间期限通常为5到7年。 仓库数据系统 7.3 数据管理技术——数据库仓库 数据仓库系统看作由数据源、数据准备区、关系型数据库、查询和分析工具组成。 数据仓库的信息源可以是层次、关系、网状等类型的数据库,也可以是各种电子表格或数据文件。 面向事务处理传统的数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据提取、清理的基础上经过系统加工、汇总和整理得到的。 面向主题 集 成 7.3 数据管理技术——数据库仓库特性 数据仓库操作 反映历史变化 7.3 数据管理技术——数据库仓库特性 数据仓库系统通常包含数据源、数据存储与管理、OLAP服务器以及前端工具与应用四个部分。 数据源是数据仓库系统的基础,是整个系统的数据源泉。 数据的存储与管理是整个数据仓库系统的核心。 OLAP服务器对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,发现数据趋势。 7.3 数据管理技术——数据库仓库系统的结构 对于数据仓库首要需求是能够管理大量数据。如何有效地管理,而且管理好数据,是最重要的要求。 数据仓库需要快捷的数据检索,因为他有大量的数据。 数据仓库也必须有多种接口。 数据仓库能够高效地装入数据。 要有多种语言接口,能并行管理数据等等。 7.3 数据管理技术——数据库仓库的基本需求 2、数据挖掘的概念 数据挖掘(Data Mining,简称DM)是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。 1、从数据仓库到数据挖掘 数据仓库剔除矛盾的数据和对决策无用的数据,汇总数据,支持决策对数据的需求。 7.3 数据管理技术——数 据 挖 掘 数据挖掘可粗略地理解为三部曲: 数据准备(data preparation)、数据挖掘,以及结果的解释评估(interpretation and evaluation)。 7.3 数据管理技术——数 据 挖 掘 数据挖掘三部曲 1.商场。啤酒和尿布。因为研究人员经过艰苦挖掘总算发现一个已婚西方男人在购买啤酒的时候有很大可能会同时购买尿布。 美国的超市有这样的系统:当你采购了一车商品结账时,售货员小姐扫描完了你的产品后,计算机上会显示出一些信息,然后售货员会友好地问你:我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗?这句话决不是一般的促销。因为计算机系统早就算好了,如果你的购物车中有餐巾纸、大瓶可乐和沙拉,则86%的可能性你要买一次性纸杯。结果是,你说,啊,谢谢你,我刚才一直没找到纸杯。这不是什么神奇的科学算命,而是利用数据挖掘中的关联规则算法实现的系统。 7.3 数据管理技术——数据挖掘的应用 2.竞技运动。美国著名的国家篮球队NBA的教练,利用IBM公司提供的数据挖掘工具临场决定替换队员。 3.金融。数据挖掘在金融领域应用广泛,包括:金融市场分析和预测、帐户分类、银行担保和信用评估等。 4.产品制造业。制造业应用数据挖掘技术进行零部件故障诊断、资源优化、生产过程分析等 5.司法。数据挖掘技术可应用于案件调查、诈骗监测、洗钱认证、犯罪组织分析等,可以给司法工作带来巨大收益。 7.3 数据管理技术——数据挖掘的应用 6.公安。 举例.在英国的格洛斯特郡警察局做了犯罪原因数据挖掘系统。这里有个很有意思的故事,在格洛斯特郡那段时间经常发生抢劫案件。我们分析了一下为什么抢劫案发生的频率会上升,结果得到两点,就是说抢劫案的发生跟两个要素相关,第一个要素是这些案犯抢劫之前会服用毒品,然后导致他的行为失控,所以会抢劫。第二个要素,就是很多抢劫案犯是无家可归的,没有固定的住所,不是说一下班就回到温暖的家,是在大街上流浪。发现这个要素以后,警方没有说简单的增加警力之类的,而是一
文档评论(0)