数据挖掘常算法.pptVIP

  • 24
  • 0
  • 约7.33千字
  • 约 10页
  • 2016-12-22 发布于河南
  • 举报
严宇宇 2013-4-18 大数据的基本特点 大数据的基本特点 数据的可验证性(Verification) 可变性(Variability) 真实性(Veracity) 邻近性(Vicinity) 从数据分析到数据挖掘 数据本身不同(数据量的不同,数据类型的不同) 数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。 数据分析有明确目标的特点,数据挖掘是一个知识发现的过程。 数据分析数据一般以文件形式或者单个数据库的方式组织,而数据挖掘必须建立在数据仓库或是分布式存储的基础之上。 大数据挖掘是传统手工业式的数据分析的现代大工业形式。 Web挖掘 基于互联网的挖掘(Web挖掘)是利用数据挖掘技术从互联网上的文档中及互联网服务上自动发现并提取人们感兴趣的信息。 可分为三类:内容挖掘 结构挖掘 用户访问模式挖掘 数据挖掘的基本流程 信息收集 数据集成 数据规约 数据清理 数据变换 数据挖掘过程 模式评估 知识表示 CRIAP-DM数据挖掘过程示意图 业务理解 数据理解 数据准备 建模 评估 部署 数据挖掘的评估 准确性 性能 功能性 可用性 辅助功能 数据挖掘的应用发展 营销领域的零售业 直效行销界 制造业 业务金融保险 通信业 医疗服务业 各种政府机关 数据挖掘的应用发展 尿不湿和啤酒 某百货零售企

文档评论(0)

1亿VIP精品文档

相关文档