- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
FoodMart商务智能
Food Mart的商务智能背景介绍Food Mart是一家跨国食品超市,每天有成千上万条来自世界各地的销售、库存等记录在其Food Mart数据库中诞生。基于大数据的背景,该公司的管理层决定为Food Mart建立数据仓库,期望能从庞大的数据中挖掘出有商业价值的信息,来进一步帮助管理层进行决策。由于数据仓库的建立是个漫长的过程,需要分期进行。在项目初期,管理层决定:先用销售数据建立数据仓库;然后,在新建的数据仓库上进行OLAP(联机分析处理);接着,基于数据仓库建立一个数据挖掘模型,挖掘(研究)办理不同会员卡的老客户有怎样的特征,进而根据新客户的信息,为新客户推荐不同的会员卡,给公司带来利润;最后,用Food Mart库存数据扩展上述数据仓库的内容,并完成上述相似的工作。需求分析现在,需要先用销售数据建立数据仓库,Food Mart数据库中记录销售数据的主要是sales_fact_1997表,如下图所示:从图中可以看出,sales_fact_1997表有五个外键:product_id,time_id,customer_id,promotion_id,store_id,所以还需要五张表:product,time_by_day,customer,promotion和store。进而,初步分析得出,目标数据仓库有一张事实表:sales_fact_1997,并以product,time_by_day,customer,promotion和store这五张表作为维表,而sales_fact_1997表中的store_sales,store_cost和unit_sales属性作为事实表的度量。建立数据库由于Food Mart公司已经有数据库,并且为我们提供了1997年和1998年的数据库备份foodmart.bak,所以我们只需要把数据库备份文件导入到我们的数据库中就可以了。打开SQL Server Management Studio ,弹出如下界面:按上图选择和输入相关信息,点击“连接按钮”,进入数据库引擎界面:接着按下图方式打开Analysis Service(此步骤方便对Analysis Service更好理解):现在,进行数据库备份的导入:右键点击“数据库”,选择“还原数据库”点击上图的“….”按钮得到如下弹出:点击“添加”按钮,把数据库备份文件foodmart.bak添加进去:点击“确定”按钮:这时候,Foodmart 2008数据库便导入到了我们的数据库中。新建项目打开Microsoft Visual Studio 2008,新建一个项目:点击“确定”按钮,得到了如下空项目从上图可以看到,我们需要完成“数据源”,“数据源视图”,“维度”(注意顺序,这里先定义维度表),“多维数据集”(数据仓库),“数据挖掘”的一系列流程。下面,我们一起一一展开进行。导入数据源右键点击“数据源”来“新建数据源”:建立数据源视图为项目建立项目与数据库之间的映射表,这里不需要把所有数据库中的表引入到数据视图中,需要什么表,就引用什么表。从需求分析里,我们知道需要一张事实表sales_fact_1997表,和product,time_by_day,customer,promotion,store五张维表。(注意:这里还没有事实表和维表,只是单纯的六张数据表,事实表和维表需要后续设计产生)右键点击“数据源视图”:这里,我们就初步建立好数据源视图。但是,可以发现这些表都是独立的,互相之间没有关联关系,这是因为数据库中的数据表并没有设置主键和外键。因而,接下来的工作是给这些表建立主键和表与表之间的联系。首先,为这些表设置“逻辑主键”:与上述操作类似,设置其它表的“逻辑主键”,得下图:因为sales_fact_1997表将要作为事实表,而product,time_by_day,customer,promotion,store五张表将要作为维表。所以将sales_fact_1997表放在中间,product,time_by_day,customer,promotion,store五张表围绕着sales_fact_1997表放置:接着,建立表与表之间的联系,把sales_fact_1997表的“product_id”属性拖曳到product表的“product_id”属性上: 然后把sales_fact_1997表的time_id,customer_id,promotion_id和store_id属性分别与time_by_day,customer,promotion和store的相应属性连接:这里发现,product表有个“product_class_id”属性,它是与product_class表的“product_class_id”主键相连,而product_
文档评论(0)