函授课程《大数据技术基础》核心内容(精简背诵版).docxVIP

  • 1
  • 0
  • 约2千字
  • 约 5页
  • 2026-06-19 发布于山西
  • 举报

函授课程《大数据技术基础》核心内容(精简背诵版).docx

函授课程《大数据技术基础》核心内容(精简背诵版)

第一章大数据概述

一、大数据定义

大数据是指无法在一定时间内用常规软件工具进行捕捉、管理、处理的海量数据集合,依靠新型处理模式,实现数据的挖掘、分析、价值提取。

二、大数据5V特征(必考)

大量性:数据体量巨大,TB、PB、ZB级别;

高速性:数据产生、流动、处理速度快;

多样性:数据类型多,结构化、半结构化、非结构化;

价值性:价值密度低、整体价值高;

真实性:数据来源真实、可靠。

三、数据分类

结构化数据:格式固定,数据库表格(Excel、数据库表);

半结构化数据:格式不固定,XML、JSON;

非结构化数据:文本、图片、音频、视频。

文档评论(0)

1亿VIP精品文档

相关文档