- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 7
PAGE 4
小型超市数据仓库系统SMDW的研究与实现1 国家自然科学基金
1 国家自然科学基支持项目
杨富华2 撰写本文期间在四川大学作访问学者
2 撰写本文期间在四川大学作访问学者
(泸州医学院计算机教研室) (四川大学计算机系)
摘要 本文介绍独立开发的小型超市数据仓库系统SMDW V1?0的主要功能、用户界面及设计开发中遇到的特殊困难和相应解决方法?并介绍该系统在关联规则挖掘中实现Aprori算法的具体措施。
关键词 数据仓库?DBMS?ODS?超市?数据挖掘?关联规则
中图法分类号 TP391
随着信息社会需求的发展和市场竞争的加剧?用户对数据库系统提出了更高的要求?从大量的业务数据中探索业务活动的规律性?进行分析和推理?从而为决策提供依据。
为了适应这一需求?数据仓库(DW)技术应运而生。数据仓库概念创始人W.H.Inmon将其定义为?“数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合?用以支持经营管理中的决策制订过程。”[4]数据仓库技术强调了“处理过程”?而不是强调某一个软件或硬件产品。数据仓库是对原始的操作数据从历史的角度组织和储存数据的处理过程?它把各个信息源中与决策支持有关的数据?经过提取、转换、过滤和集成?按主题存放起来?供决策人员查询和分析?从而作出科学性的和战略性的决策。
数据仓库已在应用中取得了明显的经济效益。例如世界上最大也是发展最快的零售商Wal*Mart利用数据仓库分析商品之间的关联。其中一个意外的发现是:跟尿布一起购买最多的商品竟是啤酒!原来先生们下班后为小孩买尿布时又随手带回两瓶啤酒。Wal*Mart就将尿布和啤酒摆放在同一货架上?结果是尿布与啤酒的销量双双增长。
结合我国国情?我们研制了一个小型超市数据仓库系统SMDW V1.0。
1 SMDW的数据源及数据仓库管理系统分析
作为数据仓库?SMDW保存的是历史数据和总结数据?数据包含相应的时间属性?数据经过集成?是面向分析环境的。尽管数据仓库的创建有着自身的特色?但本质上以传统的数据库技术作为储存数据和管理资源的基本手段。
SMDW系统由三部分组成?数据仓库、数据仓库管理系统(DWMS)和数据仓库工具。在整个系统中?数据仓库居于核心地位。而数据仓库中数据及其操作的特点?决定了其ENGINE(DWMS)将比数据库ENGINE(DBMS)简单许多。本系统中DWMS由DBMS担任。
SMDW的“主题”是用DBMS中的一系列表实现的。DBMS的关系型结构能较好地适应多维数据的表示和存储。关系数据库在模拟多维数据时将多维结构划分为两类表?事实表和维表。事实表存储事实的度量值和各个维的码值?维表存储维的描述信息?包括维的层次、成员类别和码值等?事实表通过每一维的码值同维表联系在一起?该结构被称为“星型模式”。对于层次复杂的维?为了避免冗余数据占用大量的空间?可以用多张表来描述该维。这样在“星”的角上出现了分支?这种扩展的星型模式被称为“雪花模式”。
关系数据库的XBase系列在我国曾经大量使用并积累了大量的原始操作数据?建立能够包容XBase系列为数据源的数据仓库具有现实意义。基于这一国情?SMDW V1.0版首先以XBase系列为数据源?并将在升级版本中用ODBC连接SQL Server?Oracle?Access等?以形成多数据源的数据仓库。
2 SMDW用户界面和主要功能
SMDW用户界面如下图一?主菜单有?基础数据处理?数据仓库生成?查询和分析?系统管理。其要点如下?
2.1数据提取过滤集成?从超市每日交易的详细数据中提取数据?将不一致的字段长度、不一致的赋值、丢失的数据输入等经过清理过滤?按照统一的编码、统一的格式整合集成?然后装入数据仓库。
2.2主题的选择和汇总?SMDW是面向主题的?目前版本选取了超市最重要的两个主题?商品和顾客。超市经理最关心的是商品的销量、销售额和利润?也很关心顾客的购买行为和习惯。某某顾客经常购买哪些商品?然后可以定期给他函寄商品信息。哪些商品经常被顾客一起购买?然后可以合理地摆设货架及商品?比如经典例子中的尿布与啤酒。从商品这个主题汇总了每种商品的日销量、日销售额及日利润。在日汇总的基础上?汇总了每种商品的每周、每月的销量、销售额和利润及这三个数据的日平均、最大和最小值。从顾客这个主题?汇总了每个顾客每日购买的商品的购买量和购买额(未购买商品则无相应数据)。在日汇总的基础上?汇总了每个顾客每周、每月购买商品的购买量和购买额(未购买商品则无相应数据)。
2.3查询功能?从商品这一主题?可查询超市每种商品的每日销量、销售额和利润?每种商品的每周销量、销售额和利润及这三个
您可能关注的文档
- 推进土地制度改革破解我国土地财政困境.PDF
- 挖泥船人工智能优化吹填施工.doc
- 外包与生产率基于工业行业数据的经验研究.PDF
- 外资快餐业的食品安全问题与隐患.PDF
- 完善经济适用住房退出机制研究.PDF
- 微波萃取一正交优化设计沙棘黄酮提取工艺.PDF
- 微波辅助法萃取当归多糖的条件优化.PDF
- 微带电容间隙耦合传输线带通滤波器的优化设计Ξ.PDF
- 微流控免疫芯片富集捕获EHECO157︰H7的研究.doc
- 微生物燃料电池运行条件的优化.PDF
- 半导体材料性能提升技术突破与应用案例分析报告.docx
- 半导体设备国产化政策支持下的关键技术突破与应用前景报告.docx
- 剧本杀市场2025年区域扩张策略研究报告.docx
- 剧本杀行业2025人才培训体系构建中的市场需求与供给分析.docx
- 剧本杀行业2025年人才培训行业人才培养模式创新与探索.docx
- 剧本杀行业2025年内容创作人才需求报告.docx
- 剧本杀行业2025年区域市场区域剧本市场消费者满意度与市场竞争力研究报告.docx
- 剧本杀市场2025年区域竞争态势下的区域合作策略分析报告.docx
- 剧本杀行业2025人才培训与行业人才培养模式创新.docx
- 剧本杀行业剧本创作人才心理素质培养报告.docx
文档评论(0)