数据仓库与数据挖掘 边雪芬 数据仓库 1.1 从数据库到数据仓库 1.2 什么是数据仓库 1.3 DBMS vs. DWMS 1.4 数据仓库的系统结构与相关问题 1.5 数据仓库的相关概念 1.1 从数据库到数据仓库 Why数据仓库 数据库:主要用于事务处理。数据库技术一直力图使自己能胜任从事务处理、批处理到分析处理的各种类型的信息处理任务。 但它对分析处理的支持一直不能令人满意,尤其是当以事务处理为主的OLTP(on-line transaction processing ,联机事务处理 )应用与以分析处理为主的DSS(Decision Support System ,决策支持系统)应用共存于同一个数据库系统中时,这两种类型的处理发生了明显的冲突。 1.1 从数据库到数据仓库 Why数据仓库 “蜘蛛网”问题 为了避免企业中各部门或各用户间的冲突和简化用户的数据视图,一种称作“抽取程序”的方法目前被广泛地应用。 不加控制的连续抽取最终导致系统内的数据间形成了错综复杂的网状结构,人们形象地称为“蜘蛛网”。 企业的规模越大,“蜘蛛网”问题就越严重。 虽然网上的任意两个节点的数据可能归根结底是从一个原始库中抽取出来的,但它们的数据没有统一的时间基准,抽取算法各不相同,抽取级别也不相同,并且可能参考不同的外部数据。因而对同一问题的分析,不同节点却会产生不同甚至截然相反的结果。这当然使决策
原创力文档

文档评论(0)