Hadoop大数据解决方案进阶应用 Mahout数据挖掘工具 (1) Mahout简介 数据挖掘基础 课程目标 Mahout 数据金字塔 数据统计分析 数据挖掘 数据挖掘是从大量数据中提取或“挖掘”知识 数据挖掘思想来源:假设检验,模式识别,人工智能,机器学习 数据挖掘涉及多学科技术的集成,包括数据库技术、统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息提取、图象与信号处理和空间数据分析 数据挖掘系统的组成 数据库、数据仓库、或其它信息库 数据库或数据仓库服务器 知识库 数据挖掘引擎 模式评估模块 图形用户界面 数据挖掘常用方法 数据挖掘任务可以分两类: 描述和预测 特征分析 从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征 关联规则 描述数据库中数据项之间所存在的关系的规则 变化和偏差分析 偏差分析是探测数据现状、历史记录或标准之间的显著变化和偏离 偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等 分类和预测 回归分析 聚类 欢迎访问我们的官方网站 * * * * * * * * * * * *
原创力文档

文档评论(0)