- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1
江西理工大学应用科学学院
《数据仓库与数据挖掘》课程设计报告
题 目: 某超市数据集的OLAP分析及数据挖掘
系 别:
班 级:
姓 名:
二〇一二年六月
目 录
一、建立数据仓库数据库结构和设置数据源 1
任务描述 2
建立数据仓库数据库
设置数据源
二、销售数据OLAP分析
任务描述
设计星型架构多维数据集(Sales)
设计存储和数据集处理
OLAP分析
三、人力资源数据OLAP分析
任务描述
设计父子维度的多维数据集(HR)
修改多维数据集(HR)的结构
设计存储和数据集处理
OLAP分析
四、数据仓库及多维数据集其它操作
任务描述
设置数据仓库及多维数据集角色及权限
查看元数据
创建对策
钻取
建立远程 Internet 连接
五、数据仓库高级操作
任务描述
创建分区
创建虚拟多维数据集
DTS调度多维数据集处理
备份/还原数据仓库
六、数据挖掘
任务描述
创建揭示客户模式的决策树挖掘模型
决策树挖掘结果分析
创建聚类挖掘模型
聚类挖掘结果分析
创建基于关系数据表的决策树挖掘模型
浏览“相关性网络”视图
PAGE 1
一、建立数据仓库数据库结构和设置数据源
1、任务描述
数据仓库数据库是将要在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。然后跟预先设置好的ODBC数据源建立连接。
2、建立数据仓库数据库
展开树视图的Analysis Servers;
单击服务器名或右击选择连接,与Analysis Servers建立连接;
右击服务器名,然后单击“新建数据库”命令;
在“数据库”对话框中输入数据库名“教程DW”,单击确定;
3、设置数据源
展开刚创建的“教程DW”数据库,可看到如下项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色
右击“教程DW”数据库下的“数据源”文件夹,然后单击“新数据源”命令;
在“数据链接属性”对话框中,单击“提供程序”选项卡,选择“Microsoft OLE DB Provider for ODBC Drivers”;
单击“连接”选项卡,选择建好的ODBC数据源“FoodMart 2000”;
单击确定按钮关闭“数据链接属性”对话框
图表 SEQ 图表 \* ARABIC 1 连接数据源
二、销售数据OLAP分析
任务描述
以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建多维数据集,Analysis Manager 可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。
设计星型架构多维数据集(Sales)
星型架构的多维数据集由一个事实数据表和链接到该事实数据表的多个维度表组成。
下面针对FoodMart超市1998年的销售业务数据,建立一个多维数据集,以便按产品和顾客2个主题展开分析。具体操作如下:
(1)展开树窗格的“教程DW”,右击“多维数据集”,选择“新建多维数据集”→“向导…”菜单命令,打开如下“多维数据集向导”对话框。
(2)向多维数据集添加度量值(事实) :
(3)单击下一步,在“从数据源中选择事实数据表”步骤中,展开“FoodMart”数据源,然后单击“sales_fact_1998”
(4)单击下一步,设置多维数据集的度量值列: store_sales、store_cost、unit_sales;
(5)单击下一步,建立维度表。单击新建维度,打开“维度向导”对话框;
向多维数据集添加时间维:
(1)选择维度类型为“星型架构:单个维度表”;
(2)单击下一步,选择维度表“time_by_day”;
(3)单击下一步,选择维度类型为“时间维度”;
(4)单击下一步,选择时间级别为“年、季度、月”;
(5)单击下一步,单击下一步,输入时间维名称: Time,并设为“共享”方式,单击完成,OK!
向多维数据集添加产品维:
(1)再次单击新建维度,打开“维度向导”对话框;
(2)选择创建维度的方式为“雪花架构:多个相关维度表”;
(3)单击下一步,选择维度表“Product”和“product_class”;
(4)单击下一步,查看连接方式,在这里可删除不要的连接,添加需要的连接;
(5)单击下一步,依次选择product_category、product_subcategory和brand_name三个维度级别;
(6)单击下一步,指定成员键列步骤中,不需改变主键列;
(7)单击下一步,在“高级选项”步骤中,根据需要选择;
(8)单击下一步,输入产品维名称: Product,并设为“
文档评论(0)