- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第一章 数据仓库与数据挖掘概述 1.6数据挖掘技术与工具 常用数据挖掘技术 数据挖掘的发展受到数据库系统、统计学、机器学习、可视化技术、信息技术以及其它学科的影响,例如神经网络、模糊/粗糙集理论、知识表示、归纳技术与高性能计算等。 从常用的数据挖掘技术来看可以分成三大类: 传统分析类 知识发现类 其它最新发展的一些数据挖掘技术。 * 第一章 数据仓库与数据挖掘概述 常用数据挖掘工具 数据挖掘工具按照使用方式,可以分成:决策方案生成工具、商业分析工具和研究分析工具三大类。 按照数据挖掘的技术可以分成:基于神经网络的工具、基于规则和决策树的工具、基于模糊逻辑的工具和综合性数据挖掘工具等。 按照数据挖掘的应用范围可以将挖掘工具分成专用型数据挖掘工具和通用型数据挖掘工具。 * 第一章 数据仓库与数据挖掘概述 数据挖掘工具的评价标准 模式种类的数量 解决复杂问题的能力 操作性能 数据获取能力 挖掘结果的输出 噪声数据的处理及挖掘工具的鲁棒性 * 第一章 数据仓库与数据挖掘概述 1.7 数据挖掘与数据仓库 大多数数据挖掘工具需要在集成的、一致的、经过清理的数据上进行挖掘。 数据挖掘过程中所需要的数据处理与分析工具完全可以在数据仓库的数据处理与数据分析工具中找到, 数据仓库中的OLAP完全可以为数据挖掘提供有关的数据操作支持 数据挖掘技术在数据仓库中的应用,正好弥补了数据仓库只能提供大量数据,而无法进行深度信息分析的缺陷。 * 第一章 数据仓库与数据挖掘概述 1.8 数据挖掘过程 确定挖掘对象 准备数据 建立模型 数据挖掘 结果分析 知识应用阶段 业务对象 目标数据 预处理数据 商业模式 知识 应用方案 * 第一章 数据仓库与数据挖掘概述 业务分析人员 数据分析人员 数据管理人员 1.10 数据挖掘的用户 * 第一章 数据仓库与数据挖掘概述 作业 一、习题中的1,3,5,11,12, 二、什么是数据挖掘? 三、数据仓库与传统的数据库有何区别? 四、为什么在分析决策中需要建立数据仓库而不直接在传统数据库上进行? 第一章 数据仓库与数据挖掘概述 数据仓库与数据挖掘 数据仓库与数据挖掘 本课程共32学时,其中理论20学时,实验12学时 成绩评定: 平时表现:占10% 平时作业:占20% 实验及大作业(含口试):70% 大作业要求:自己搜集数据集(网上下载或者通过其它途径获得),并将数据装载到数据仓库并对数据进行挖掘分析,得到有关的挖掘结果,撰写相关报告。要求一人一题 数据下载的一个参考地址:/data/list/602002 * 第一章 数据仓库与数据挖掘概述 第1章 数据仓库与数据挖掘概述 数据挖掘与分析人员的市场需求 /city-shanghai/kind125010/ * 第一章 数据仓库与数据挖掘概述 几个应用实例的网址 /(人立方) /(亚马逊) * 第一章 数据仓库与数据挖掘概述 数据仓库与数据挖掘概述 1.1学习数据仓库与数据挖掘的意义 1.2为何建立数据仓库 1.3什么是数据仓库 1.4 数据仓库的体系结构 1.5数据挖掘由来 1.6什么是数据挖掘 1.7 数据挖掘技术与数据挖掘工具 1.8 数据挖掘的基本过程 1.9 数据挖掘与数据仓库的关系 练 习 * 第一章 数据仓库与数据挖掘概述 1.1学习数据仓库与数据挖掘的意义 引言: 社会信息化后社会的运转是软件的运转 社会信息化后社会的历史是数据的历史 时代背景 网络化时代:通信、计算机和网络改变着人类和社会。 18个月翻一番(芯片集成度、CPU速度、信道传输速率 * 第一章 数据仓库与数据挖掘概述 信息传播的背景 在美国,广播达到5000万户用了38年;电视用了13年;Internet拨号上网达到5000万户仅用了4年。全球IP网发展速度达到每6个月翻一番,国内情况亦然。1999年初,中国上网用户为210万,现在已经达到3.84亿(09年底)。网络的发展导致经济全球化,在1998年全球产值排序前100名中,跨国企业占了51个,国家只占49个。 * 第一章 数据仓库与数据挖掘概述 划时代意义的技术 有人提出,对待一个跨国企业也许比对待一个国家还要重要。在新世纪钟声刚刚敲响的时候,回顾往昔,人们不仅要问:就推动人类社会进步而言,历史上能与网络技术相比拟的是什么技术呢?有人甚至提出要把网络技术与火的发明相比拟。火的发明区别了动物和人,种种科学技术的重大发现扩展了自然人的体能、技能和
原创力文档


文档评论(0)