《计算机网络课程设计》指导书
自编
北京信息科技大学
计算机学院
数据仓库与数据挖掘课程组
2012年11月
目 录
实验一:数据仓库的环境配置与构建实验
实验二:数据仓库的OLAP技术实验
实验三:数据挖掘方法实践实验
实验一、数据仓库的环境配置与构建实验
实验目的:
1)了解数据挖掘与商务智能之间的联系与区别;
2)分析数据挖掘仓库的特性和构架;
3)掌握数据挖掘的功能和建模的标准CRISP-DM。
4)掌握MSS的分析服务、报表服务和整合服务,并能够用以解决实际问题。
实验结果分析与要求:
完成实验目的中的内容,记录操作中的各个步骤,并进行分析。
实验内容:
1、将Excel数据表导入SQL数据库中的数据表
材料:SQL范例资料.xls中的三国表。
软件:SQL Server 2008 R2
基本步骤:
首先按照三国表中的属性在数据口中建立对应的表。
打开VS选择项目中的“Integration Services”项目,并制定项目的保存位置,最后单击“确定”按钮即可新建一个SSIS项目。
在“控制流”选项卡中,从工具箱拖拽“数据挖掘查询任务”的图示到工作区中。
切换“数据流”选项卡,先制定数据的源,因为要导入的是Excel数据,所以从工具箱拖拽Excel源的图示到工作区中,然后再Excel源上右击,选择菜单上的“编辑”。
在Excel源编辑器中,单击“新建”按钮来制定Excel数据的源,在Excel连接管理器中,单击“浏览”按钮来选择Excel文件,完成后单击“确定”按钮。
在“Excel工作表的名称”下拉列表中选择要导入的数据表,然后单击“确定”按钮,完成数据源的设置。
建立数据转换,从工具箱中拖拽“数据转换”到工作区中。
在Excel源上右击,选择“添加路径”。
指定“Excel源”到“数据转换”,最后单击“确定”按钮。
输出指定“Excel源输出”,输入指定“数据转换输入”,单击“确定”按钮。
设置数据流的目标,要导入到SQL的数据库中,从工具箱中拖拽“SQL Server目标”到工作区。
然后在“数据转换”上右击,选择添加路径来建立与数据流目标的连接。
在“数据流”对话框中,指定从“数据转换”到“SQL Server目标”,单击“确定”按钮。在“选择输入输出”对话框中,输出指定“数据转换输出”,输入指定“SQL Server目标输入”,单击“确定”按钮。
最后设置数据导入的位置,在“SQL Server目标”上右击,选择“编辑”。
在“SQL 目标编辑器”窗口中,单击“新建”按钮,然后在“配置 OLE DB连接管理器”窗口转中,同样单击“新建”按钮。
在“连接管理器”窗口中,“服务器名”选择SQL数据库的位置,在“登录到服务器”中选择“使用windows身份验证”,在“选择或输入一个数据库名”指定数据要导入的数据库,单击“确定”按钮返回上一个窗口,再单击“确定”按钮。
最后要指定数据要导入哪一个数据表,选择完成后单击“确定”按钮。
接下来选择“映射”,接着单击“确定”按钮即可。
现在已经完成配置,单击“启动调用”按钮,测试是否错误,执行完毕为绿色,执行中为黄色,错误为红色。
可以到导入的SQL数据库的数据表位置查看数据是否都已经导入了。选择SQL Server Management Studio打开后找到之前导出的数据表来查看。
选择“选择前1000行”后则可以看到结果。
2、对数据进行抽样
材料:SQL范例资料.xls中的三国表。
软件:SQL Server 2008 R2
基本步骤:在“数据转换”中选择“百分比抽样”,抽样的百分比为20%。其他同“将Excel数据表导入SQL数据库中的数据表”的操作步骤。
实验二、交换机数据仓库的OLAP技术实验
实验目的:
1)掌握决策树模型的基本概念和计算方法,并用其预测三国表中“身份属性”与其他属性的关系;
2)掌握贝叶斯分类器的基本概念,并用其预测三国表中“身份属性”与其他属性的关系;
3)掌握关联规则的基本概念和种类,并用其预测“肾细胞癌转移情况”。
4)对比以上三种模型,分析其联系与区别。
实验结果分析与要求:
完成实验目的中的内容,记录操作中的各个步骤,并进行分析。
实验内容:
使用决策树模型预测三国表中“身份属性”与其他属性间的关系;
材料:SQL范例资料.xls中的三国表。
软件:SQL Server 2008 R2
基本步骤:
首先将三国表导入到SQL数据库中。
新建Analysis Service 项目,进入项目中的新建挖掘结构,使用数据挖掘向导来建立,进入数据挖掘向导首页后单击“下一步”按钮。
从现有关系数据库或数据仓库读取数据,即为默认值,故直接在这个页面单击“下一步”按钮。
到数据挖掘技术部分,选择“Microsoft决
您可能关注的文档
- 《景观设》课程标准.doc
- 1450锈钢冷轧带钢轧机液压压下装置设计.doc
- MAST为风格测试来源于组织行为学.doc
- 《机械制装备设计》模拟试题1-4.doc
- 《口袋奴》 建筑攻略详解.doc
- 《劳动合书》.doc
- 1617冬巴黎时装周|Christian Dior女装秀场.docx
- Matlb基础知识学习笔记.docx
- 《历史学知识与教学能力》(高级中学)笔试大纲.doc
- 1694常见问题解答(1).doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 保障农民工工资支付协调机制和工资预防机制.docx VIP
- (35页PPT)腾讯iOA零信任安全解决方案.pptx
- 供应链管理第章.ppt VIP
- 有机化学醇酚醚.ppt VIP
- 【真题】2025年湖北省公务员考试《申论》试题及答案解析(县乡卷).pdf VIP
- 《2025年人工智能在制造业应用》.docx VIP
- 2018年浙江省杭州市中考科学试卷含答案.docx VIP
- 东北地区自然地理概况课件市公开课一等奖省赛课微课金奖课件.pptx VIP
- Power Up3课后单元测试 - U7 - Unit Test.docx VIP
- EN755-2铝及铝合金挤压杆材,管材及型材 第2部分:机械性能.doc
原创力文档

文档评论(0)