- 1
- 0
- 约2.13万字
- 约 83页
- 2024-04-30 发布于浙江
- 举报
数据挖掘分析与业务预测
【-)阿里云
课程目标
学习完本课程后,你将能够:
1.掌握数据挖掘的相关概念、相关知识
2.掌握数据挖掘与机器学习的区别和联系
3.掌握数据挖掘常见方法及其常见业务应用
1【-〕阿里云
课程目录
1.数据挖掘概述
1.1什么是数据挖掘
1.2数据挖掘与机器学习
2.数据挖掘相关方法及业务应用
2【-〕阿里云
数据挖掘是一个以数据为中心的循序渐进的螺旋式的
数据探索过程;
数据挖掘是各种分析方法的集合,是多种数据分析、
处理方法的配合应用;
数据挖掘的最终目的是辅助决策;
当前数据挖掘系统具有分析海量数据的能力。
数据挖掘(Datamining,简称DM)是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
由于数据通常存于数据库中,因此人们又称之为“数据库中知识发现”。数据挖掘是一个过程,
而非单纯的数学建模。
3【-〕阿里云
什么是数据挖掘
数据准备
个↓
建模
商业问题定义数据理解
评估
部署
Data
大数据时代的数据特征决定了数据挖掘的变化
云计算为数据挖掘提供了强大的处理能力
大数据的应用推动了数据挖掘的发展
新算法为数据挖掘带来新的活力
.
大数据下的数据挖掘
【-〕阿里云
挖掘平台
数据挖掘的功能
数据挖掘功能用于指定数据挖掘任务中需找的模式类型。
描述:挖掘的任务是描述目标数据的特性,如特征描述、关联分析、聚类、离群点等。
预测:根据当前数据预测未来,
如回归和分类
5【-〕阿里云
数据挖掘与数据仓库
根据数据存在方式,用于数据挖掘的数据可以是数据库、数据仓库、文本、多媒体数据源等等;由
于企业数据仓库系统就是面向数据统计、分析应用的,因此数据挖掘一般依赖于企业数据仓库系统的数据。从数据仓库的角度看,数据挖掘可以看做是数据仓库高阶段的OLAP分析。
数据挖掘
数据统计分析
数据仓库
6【-〕阿里云
OLAP分析
应用
数据挖掘的应用分类
数据挖掘技术的基本任务主要体现在关联规则、分类与回归、聚类、时序模式、偏差检验等几个方面。
关联规则揭示数据间关系,但这种关系没有在数据中
直接体现出来,需从数据中利用数据挖掘找出来;
时序模式描述基于时间序列或其他序列的经常发生的
规律或趋势;
偏差检验,偏差是对差异和极端特例的表述,偏差检
分类就是将数据映射到预先定义好的群组或类别;
回归则是用属性的历史数据预测未来趋势;
聚类则是根据数据属性的相似度给未分类的数据分类,
使数据分类后类内相似度大,类间差异大;
聚类
常见算法
7【-〕阿里云
验则是用来发现与正常情况不同的异常和变化。
时序模式
关联规则
分类与
回归
偏差检测
需求分析数据预处理特征工程分析建模模型评估与应用
数据挖掘的一般过程
8【-〕阿里云
数据+工具+方法+目标+行动=价值
电信公司挖掘未来5G客户:
通信世界的演化很快,几乎10年就是一个时代,从上世纪90年代的2
您可能关注的文档
最近下载
- 餐饮qsc管理培训课件.ppt VIP
- 养老九防培训课件.pptx VIP
- 物业对外包的管理规定.pptx VIP
- 往复式压缩机气阀、活塞和活塞杆密封技术的可靠性改进介绍.pdf VIP
- 影视项目策划书模板-完整版.docx VIP
- 原文及注释《〈论语〉十二章》.docx VIP
- 四篇对照“学习贯彻党的创新理论、加强党性锤炼、联系服务群众、发挥先锋模范作用、改作风树新风”等五个方面2026年组织生活会对照检查材料.docx VIP
- 高压电缆基础知识.ppt VIP
- 2025年高考数学高考数学二轮热点题型选填题(新高考通用)专题02基本不等式求最值(常考7大题型)(原卷版+解析).docx VIP
- 2025年贵州省公务员考试申论真题(B类)及答案解析.docx VIP
原创力文档

文档评论(0)