- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 数据挖掘基础 【教学目标与要求】 了解数据挖掘的产生背景与发展现状 理解数据挖掘的概念并掌握数据挖掘的过程 了解数据挖掘的典型应用领域及发展趋势 5.1 数据挖掘的产生与发展 5.2 数据挖掘的定义 5.3 数据挖掘过程 5.4 数据挖掘系统 5.5 数据挖掘的功能和方法 5.6 数据挖掘的典型应用领域 5.7 数据挖掘的发展趋势 目录 1.背景材料 2.案例分析 数据挖掘和知识发现是智能管理领域中的研究热点。 数据挖掘是按照既定的业务目标,对大量的数据进行探索,揭示其中隐藏的规律性,并进一步将其模型化的先进、有效的大量数据进行处理与分析的方法。 数据挖掘技术能够帮助决策者从海量数据中挖掘出隐藏着的规律性,以支持管理者及时做出正确而科学的经营管理决策。 【导入案例】 如何从这些大量数据中发现有用的信息,如何理解已有的历史数据并用以预测未来的行为,变被动的数据为主动有价值的知识,指导企业和政府决策,获取更大的经济效益和更好的社会效益,这些都唤起了人们对数据进一步筛选、加工、挖掘其中所蕴涵知识的需求。数据挖掘(Data Mining,DM)正是在这样的背景下而产生的。 5.1 数据挖掘的产生与发展 数据挖掘除了应用统计方法之外,还应用了大量计算机科学的技术,例如数据库技术和机器学习。 随着计算机技术的迅速发展,数据库技术为数据挖掘提供了良好的数据基础,对数据源的管理更加完备 机器学习技术,如神经网络、案例学习、决策树等,使人们不需要了解其内部复杂的原理,也可以通过这些方法获得良好的分析和预测效果;同时数据挖掘还从机器学习那里继承了实验的方式和态度,大大提高了数据挖掘技术的实用性和可信度 5.1 数据挖掘的产生与发展 数据挖掘广泛应用在交通、银行、电信、保险、零售等商业领域。数据挖掘所能解决的典型商业问题包括:数据库营销、客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用记分、欺诈发现等 5.1 数据挖掘的产生与发展 数据挖掘是个多学科交叉研究领域 从技术角度来看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。 从商业角度来看,数据挖掘就是按企业的既定业务目标,对大量的企业数据进行探索和分析,以揭示隐藏的、未知的规律性并将其模式化,从而支持商业决策活动 5.2 数据挖掘的定义 5.3 数据挖掘过程 (1) 业务理解 (2) 数据理解 (3) 数据预处理 (4) 建立模型 (5) 模型评估和解释 (6) 实施与维护 5.4.1 数据挖掘系统的分类 (1)根据挖掘的数据库类型分类 (2)根据挖掘的知识类型分类 (3)根据挖掘方法分类 (4)根据数据挖掘应用的分类 5.4.2 数据挖掘系统的发展 5.4 数据挖掘系统 一、数据挖掘的功能 关联分析 、概念描述、数据总结、分类分析、聚类分析、时间序列分析、偏差分析、建模等 二、数据挖掘的方法 决策树方法、神经网络方法、粗糙集理论、Bayesian网络、可视化方法、生物智能算法等。 有时对于某一数据库很有效的算法对另一数据库有可能完全无效,因此,针对具体的挖掘目标和应用对象而设计不同的算法。 5.5 数据挖掘的功能和方法 1.数据挖掘在人力资源管理中的应用 1) 数据挖掘在员工细分中的应用 2) 数据挖掘在员工保持中的应用 3) 数据挖掘在人员雇佣决策中的应用 2 数据挖掘在客户关系管理(CRM)中的应用 3 数据挖掘在银行领域的应用 4 数据挖掘在信息安全中的应用 5 数据挖掘在税务系统中的应用 5.6 数据挖掘的典型应用领域 数据挖掘是一门综合性学科,一个多学科交叉的研究领域。它融合了数据库技术、人工智能、机器学习、统计学、知识工程、信息检索、高性能计算及数据可视化等许多学科的概念、理论、方法和技术。经过20年的研究和实践,数据挖掘已经吸收了许多学科的研究成果,成为独具特色的研究分支。 5.7 数据挖掘的发展趋势 1)数据挖掘理论与算法的研究 2)复杂数据类型的挖掘问题 3)数据挖掘语言与数据挖掘的可视化 4)数据挖掘的性能问题 5)数据挖掘系统的构架 6)交互式数据挖掘技术 7)数据挖掘的私有性问题 8)数据挖掘中的不确定性问题 9)数据挖掘中的动态性问题 5.7 数据挖掘的发展趋势
文档评论(0)