- 1、本文档共67页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘 本科论文
《数据仓库与数据挖掘》大作业
院(系)名称 信息技术学院 专 业 年 级 10级电子商务 学号 101144054 学生姓名 张泽果
目 录
第1章 数据仓库和数据挖掘简介 1
1.1数据仓库的概念 1
1.2数据挖掘引论 1
1.2.1 数据挖掘的作用 1
1.2.2数据挖掘对企业的影响 2
1.2.3数据挖掘概念 3
1.3数据挖掘与数据仓库的关系 4
1.4?数据仓库与数据挖掘的区别 5
第2章 创建数据仓库 6
2.1 数据仓库的来源 6
2.2 数据表的结构 6
第3章 关联规则挖掘 8
3.1 案例背景 8
3.2 数据来源 9
3.3 关联规则的应用 9
3.3.1 Microsoft SQL Server 2005 Analysis Services操作步骤 9
3.3.2模型解释 17
3.4小结 19
第4章 分类挖掘 20
4.1案例背景 20
4.2数据来源 20
4.3分类挖掘的应用 21
4.3.1 Microsoft SQL Server 2005 Analysis Services操作步骤 21
4.3.2模型解释 26
4.4小结 28
第5章 聚类挖掘 29
5.1案例背景 29
5.2数据来源 29
5.3聚类挖掘的应用 30
5.3.1 Microsoft SQL Server 2005 Analysis Services操作步骤 30
5.3.2模型解释 32
5.4小结 36
第1章 数据仓库和数据挖掘简介
1.1数据仓库的概念
什么是数据仓库,目前有一下不同的看法:
定义1:W.H.Inmon在《Building the Data Warehouse》中定义数据仓库为:“数据仓库是面向主题的、集成的、随时间变化的、历史的、稳定的、支持决策制定过程的数据集合。” 即数据仓库是在管理人员决策中的面向主题的、集成的、非易失的并且随时间而变化的数据集合。
定义2:“DW是作为DSS基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需的信息。”
定义3:“DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的。即与企业定义的时间区段相关,面向主题且不可更新的数据集合。”
定义4:数据仓库是一种来源于各种渠道的单一的、完整的、稳定的数据存储。这种数据存储提供给可以允许最终用户的可以是一种他们能够在其业务范畴中理解并使用的方式。
定义5:数据仓库是大量有关公司数据的数据存储。
定义6:仓库提供公司数据以及组织数据的访问功能,其中的数据是一致的(consistent),并且可以按每种可能的商业度量方式分解和组合;数据仓库也是一套查询、分析和呈现信息的工具;数据仓库是我们发布所用数据的场所,其中数据的质量是业务再工程的驱动器(driver of business reengineering)。
定义的共同特征:首先,数据仓库包含大量数据,其中一些数据来源于组织中的操作数据,也有一些数据可能来自于组织外部;其次,组织数据仓库是为了更加便利地使用数据进行决策;最后,数据仓库为最终用户提供了可用来存取数据的工具。
综合对数据仓库的各种理解以及其特征,我们可以定义数据仓库是一种为信息分析提供了良好的基础并支持管理决策活动的分析环境,是面向主题的、集成的、稳定的、不可更新的、随时间变化的、分层次的多维的集成数据集合。
1.2数据挖掘引论
1.2.1 数据挖掘的作用
数据挖掘解决诸如欺诈甄别(fraud detection)、保留客户(customer retention)、 消除摩擦(attrition)、数据库营销(database marketing)、市场细分(market segmentation)、风险分析(risk analysis)、亲和力分析(affinity analysis)、客户满意度(customer satisfaction)、破产预测(bankruptcy prediction)、职务分析(portfolio analysis)等业务问题提供了有效的方法。
例如,数据挖掘运用于客户行为分析,企业从中受益体现在以下四个方面:
1.可以方法顾客和访问者的爱好、生活模式等。
2.可以解决怎样来争取新顾客,怎样使产品适销对路,怎样给产品定价,怎样吸引单个顾客,怎样优化Web站点等问题。即可以通过顾客定制和指定的产品和服务交换信息,对Web上的商业模式建模,预测、了解影响销售的各种因素,以便迅速调整其市场、价格、存货等;通过页面访问情况,分析出的客户生活和购物模式,根据客户的爱好等来定制个性化Web界面。
3.可以利用相应的信息确定顾客消费的生命周期,针对不同的产品定制相应的营销策略。
4.可以却东
文档评论(0)