- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库系统应用案例 -------以小型超市为例
1
u SMDW--Small Super Market Data Warehouse,
经营资本 5000万元 以下
u 数据仓库技术强调了“处理过程”而不是强调某一个软件或硬件产品。
1 SMDW数据仓库要点
2
u 数据仓库是对原始的操作数据从历史的角度组织和储存数据的处理过程它把各个信息源中与决策支持有关的数据经过提取(Extract)、转换(Transform)、过滤和装载(Load)集成按主题存放起来供决策人员查询和分析从而作出科学性的和战略性的决策。开发重点和难点在ETL
比喻:
基本数据库(运行数据库)-----水泥,钢筋,砂
数据集市----预制件 (星型,雪花型)面向被被解决问题(主题),
用预制件组装 比用 水泥,钢筋,砂临时浇铸 快,好
1 SMDW数据仓库要点(续)
3
数据仓库、数据仓库管理系统(DWMS)和数据仓库工具。
核心:数据仓库DWMS, 由DBMS+界面+专用程序实现。
主题: 用DBMS中的一系列表实现。
关系数据库在模拟多维数据时将多维结构划分为两类表事实表和维表。
星型模式和雪花模式并存兼容的方式。
三部分组成
2 SMDW组成
4
由于XBase系列在我国曾经大量使用并积累了大量的原始操作数据 基于这一国情SMDW V1.0版允许XBase系列为数据源
在升级版本中用ODBC连接SQL ServerOracleAccess等以形成多数据源的数据仓库。
2 SMDW组成(续)
5
3 SMDW用户界面和主要功能
6
3.1数据提取过滤集成从超市每日交易的详细数据中提取数据将不一致的字段长度、不一致的赋值、丢失的数据输入等经过清理过滤按照统一的编码、统一的格式整合集成然后装入数据仓库。
3.2主题的选择和汇总SMDW是面向主题目前版本选取了超市最重要的两个主题商品和顾客。
超市经理最关心问题:
某某顾客经常购买哪些商品?
哪些商品经常被顾客一起购买?
3 SMDW用户界面和主要功能
7
顾客主题
汇总每个顾客每日购买的商品的购买量和购买额(未购买商品则无相应数据)。每个顾客每周、每月购买商品的购买量和购买额。
商品主题
汇总每种商品的日销量、日销售额及日利润。每周、每月的销量、销售额和利润及这三个数据的日平均、最大和最小值。
3 SMDW用户界面和主要功能
8
商品主题:
每种商品的每日销量、销售额和利润每种商品的每周销量、销售额和利润及这三个数据的日平均、最大、最小值每种商品的每月销量、销售额和利润及这三个数据的日平均、最大、最小值
结果可以表格和图形(直方图、圆饼图、折线图等)两种方式显示。
分析出什么商品最畅销什么商品最赚钱用以指导超市的经营策略。
查询功能
9
顾客主题
可查询每个顾客每日的购买量和购买额每周的购买量和购买额每月的购买量和购买额
查询结果可以表格和图形(直方图、圆饼图、折线图等)两种方式显示。
查询结果可知顾客的购买力和购买行为如某顾客经常买高档商品则说明他的购买力强某顾客常常买中低档商品少有买高档商品则说明他的购买力一般
超市从而可有针对性地培养顾客群。
查询功能
10
l 可分析超市日销售额、日利润月趋势周销售额、周利润年趋势月销售额、月利润年趋势并以表格和图形(直方图、折线图、圆饼图等)两种方式显示结果。
l 可作历史比较和趋势分析。
可作关联规则挖掘 “在购买面包和黄油的顾客中有90%的人同时也买了牛奶”(面包+黄油→牛奶)。关联规则挖掘在给定支持度阈值后, 使用Apriori算法 分析哪些商品顾客最有可能一起购买从而预测顾客未来的购买行为以便为顾客提供更好的服务以吸引顾客扩大市场。
数据挖掘分析
11
系统把用户分为超级用户和一般用户并拥有不同的权限和口令。一般用户只能见到常规数据无权查看敏感数据。
SMDW的系统安全管理
12
4 SMDW体系结构
13
l 源数据SMDW的数据来源于超市各分店每日交易数据即多个关系数据库。
l 提取转换
l 仓库管理 元数据(数据结构、转换规划、仓库结构、控制信息)。仓库管理包括对数据的安全、归档、备份、维护、恢复等工作这些工作需要利用数据库管理系统(DBMS)的功能。
l 查询分析工具用于完成实际决策问题所需的查询检索工具、
L 数据挖掘分析工具等以实现决策支持系统的各种要求。
4 SMDW体系结构(续)
14
扩展的雪花模式 有多个事实表的雪
文档评论(0)